Term의 분포

Tags:

Heaps law
코퍼스내 unique term의 수는 (문서의 길이)^b 에 비례. b는 보통 0.4-0.6사이의 수

Zipf’s Law
어떤 term의 빈도는 term빈도에따라 term들을 나열했을때의 랭킹에 반비례

Comments

2 responses to “Term의 분포”

  1. self Avatar
    self

    링크를 읽어보니 Heap’s law에서 문서의수가 아니라 문서의 길이가 되어야 맞는 것 같습니다. 감사합니다.

  2. Minkoo Seo Avatar
    Minkoo Seo

    그렇군요. 제가 좀 부정확하게 정리를 했네요.. 수정했습니다. 감사드려요~

Leave a Reply

Your email address will not be published. Required fields are marked *