Законы Зипфа
Здравствуйте.
В мире поисковых технологий хорошо известны эмпирические законы Зипфа, о частоте появления того или иного ключевого слова в документе запрошиваемых через поисковик. (Сейчас не получается четко кристаллизовать мысль) При использовании логарифмических шкал прогнозируемая прямая линия практически точно совпадает с линией частот терминов, имея расхождение только в старших числах. График находил, но он куда то канул. Запросы иллюстрировались к сайту sun.com . Не занимался ли кто-нибудь этим вопросом, и не попадалось ли путного документа описывающего эти законы? P.S. Оговорюсь, есть множество статей популярного характера, мол есть такие законы бла-бла-бла и все молодцы, эти статьи не подходят. Хотелось бы ссылку, на которую не стыдно сослаться в собственном выступлении. (Тезисы уже готовы, "путного Зипфа" пока не попалось) |
|
Цитата:
На вики конечно ссылаться нельзя, а на pdf документ из дополнительных ссылок вполне. |
Время: 17:23. |
Время: 17:23.
© OSzone.net 2001-