Heaps law
코퍼스내 unique term의 수는 (문서의 길이)^b 에 비례. b는 보통 0.4-0.6사이의 수
Zipf’s Law
어떤 term의 빈도는 term빈도에따라 term들을 나열했을때의 랭킹에 반비례
Passion is like genius; a miracle.
Blog on Software, Statistics, and Quant
Tags:
Heaps law
코퍼스내 unique term의 수는 (문서의 길이)^b 에 비례. b는 보통 0.4-0.6사이의 수
Zipf’s Law
어떤 term의 빈도는 term빈도에따라 term들을 나열했을때의 랭킹에 반비례
링크를 읽어보니 Heap’s law에서 문서의수가 아니라 문서의 길이가 되어야 맞는 것 같습니다. 감사합니다.
그렇군요. 제가 좀 부정확하게 정리를 했네요.. 수정했습니다. 감사드려요~
Leave a Reply