Lei de Zipf

A lei de Zipf , em probabilidade, afirma que as frequências f de certos eventos são inversamente proporcionais à sua classificação r . A lei foi originalmente proposta pelo lingüista americano George Kingsley Zipf (1902–50) para a frequência de uso de diferentes palavras na língua inglesa; esta frequência é dada aproximadamente por f ( r ) ≅ 0,1 / r . Assim, a palavra mais comum (classificação 1) em inglês, que é the , ocorre cerca de um décimo das vezes em um texto típico; a próxima palavra mais comum (classificação 2), que é de , ocorre cerca de um vigésimo das vezes; e assim por diante. Outra maneira de olhar para isto é que um posto r palavra ocorre 1 /r vezes mais que a palavra mais frequente, de modo que a palavra de nível 2 ocorre com metade da frequência da palavra de nível 1, a palavra de nível 3 um terço mais frequente, a palavra de nível 4 um quarto mais frequente e assim por diante. Além de cerca de 1.000, a lei quebra completamente.

A lei de Zipf supostamente foi observada por muitas outras estatísticas que seguem uma distribuição exponencial. Por exemplo, em 1949, Zipf afirmou que a maior cidade de um país tem cerca de duas vezes o tamanho da segunda maior, três vezes o tamanho da terceira maior, e assim por diante. Embora o ajuste não seja perfeito para idiomas, populações ou quaisquer outros dados, a ideia básica da lei de Zipf é útil em esquemas de compressão de dados e na alocação de recursos por planejadores urbanos.

William L. Hosch