Concept
Zipf's law
Zipf's law is an empirical law stating that given some corpus of natural language utterances, the frequency of any word is inversely proportional to its rank in the frequency table. Thus the most frequent word will occur approximately twice as often as the second most frequent word, three times as often as the third most frequent word, and so on. It is often used in linguistics to analyze word distributions.
齐普夫定律是一条经验定律,它指出在给定的自然语言语料库中,任何词语的出现频率与其在频率表中的排名成反比。因此,最频繁出现的词语出现的次数大约是第二频繁词语的两倍,是第三频繁词语的三倍,依此类推。齐普夫定律常被用于语言学中对词语分布的分析。
La ley de Zipf es una ley empírica que establece que, dado un corpus de enunciados en lenguaje natural, la frecuencia de cualquier palabra es inversamente proporcional a su rango en la tabla de frecuencias. Por lo tanto, la palabra más frecuente aparecerá aproximadamente el doble de veces que la segunda palabra más frecuente, el triple de veces que la tercera palabra más frecuente, y así sucesivamente. Se utiliza con frecuencia en lingüística para analizar las distribuciones de palabras.
قانون زِف هو قانون تجريبي ينص على أنه في أي مجموعة من عبارات اللغة الطبيعية، فإن تكرار أي كلمة يتناسب عكسيًا مع ترتيبها في جدول التكرار. وبهذا فإن الكلمة الأكثر تكرارًا ستظهر تقريبًا مرتين أكثر من الثانية في التكرار، ثلاث مرات أكثر من الثالثة في التكرار، وهكذا. ويُستخدم هذا القانون غالبًا في علم اللغة لتحليل توزيع الكلمات.
A lei de Zipf é uma lei empírica que afirma que, dada alguma coletânea de enunciados em linguagem natural, a frequência de qualquer palavra é inversamente proporcional ao seu posto na tabela de frequências. Assim, a palavra mais frequente ocorrerá aproximadamente duas vezes mais do que a segunda palavra mais frequente, três vezes mais do que a terceira palavra mais frequente, e assim por diante. É frequentemente utilizada na linguística para analisar distribuições de palavras.
ज़ीफ़ का नियम एक अनुभवजन्य नियम है जो बताता है कि प्राकृतिक भाषा के कथनों के कोई भी कॉर्पस दिया गया हो, तो किसी शब्द की आवृत्ति आवृत्ति सारणी में उसके रैंक के व्युत्क्रमानुपाती होती है। इस प्रकार सबसे अधिक आवृत्ति वाला शब्द लगभग दूसरे सबसे अधिक आवृत्ति वाले शब्द की दोगुनी बार आएगा, तीसरे सबसे अधिक आवृत्ति वाले शब्द की तीन गुना बार आएगा आदि। इसका उपयोग अक्सर भाषाविज्ञान में शब्द वितरण के विश्लेषण में किया जाता है।
Hukum Zipf adalah sebuah hukum empiris yang menyatakan bahwa diberikan suatu kumpulan pernyataan bahasa alami, frekuensi setiap kata berbanding terbalik dengan peringkatnya dalam daftar frekuensi. Dengan demikian, kata yang paling sering muncul akan terjadi sekitar dua kali lebih sering daripada kata kedua yang paling sering muncul, tiga kali lebih sering daripada kata ketiga yang paling sering muncul, dan seterusnya. Hukum ini sering digunakan dalam ilmu linguistik untuk menganalisis distribusi kata.
La loi de Zipf est une loi empirique selon laquelle, étant donné un corpus d'énoncés en langue naturelle, la fréquence de tout mot est inversement proportionnelle à son rang dans le tableau de fréquence. Ainsi, le mot le plus fréquent apparaîtra approximativement deux fois plus souvent que le deuxième mot le plus fréquent, trois fois plus souvent que le troisième mot le plus fréquent, et ainsi de suite. Elle est souvent utilisée en linguistique pour analyser les distributions des mots.
ジップの法則とは、自然言語の語彙の出現頻度に関する経験則で、ある語彙の出現頻度はその頻度順位表における順位に反比例するという法則である。つまり、最も頻繁に出現する語は、2番目に頻繁に出現する語の約2倍、3番目に頻繁に出現する語の約3倍の頻度で出現する。この法則は、言語学において語彙分布の分析に広く用いられている。
Закон Ципфа — эмпирический закон, утверждающий, что в любом корпусе высказываний на естественном языке частота употребления любого слова обратно пропорциональна его рангу в таблице частот. Таким образом, наиболее часто встречающееся слово будет встречаться приблизительно в два раза чаще, чем второе по частоте слово, в три раза чаще, чем третье по частоте слово, и так далее. Закон часто используется в лингвистике для анализа распределения слов.
Zipfsches Gesetz ist eine empirische Regel, die besagt, dass bei einem bestimmten Korpus natürlicher Sprachäußerungen die Frequenz eines beliebigen Wortes umgekehrt proportional zu seinem Rang in der Frequenztabelle ist. Demnach tritt das am häufigsten vorkommende Wort ungefähr doppelt so oft auf wie das zweithäufigste Wort, dreimal so oft wie das dritthäufigste Wort und so weiter. Es wird häufig in der Linguistik verwendet, um Wortverteilungen zu analysieren.
지프의 법칙은 자연어 문장 집합에서 어떤 단어의 빈도가 빈도순위표에서의 순위에 반비례한다는 경험적 법칙이다. 즉, 가장 자주 나타나는 단어는 두 번째로 자주 나타나는 단어보다 약 두 배, 세 번째로 자주 나타나는 단어보다는 약 세 배 자주 나타난다. 이 법칙은 언어학에서 단어 분포를 분석하는 데 자주 활용된다.