Entrada destacada:

¿Cumple este blog con la ley de Zipf?

Los días y las frases: la ley de zipf aplicada a bloggs. George Kingsley Zipf fue un lingüista norteamericano de mediados del sigl...

domingo, 22 de septiembre de 2019

¿Cumple este blog con la ley de Zipf?

Los días y las frases: la ley de zipf aplicada a bloggs. Ley de Zipf estadisticas blog
George Kingsley Zipf fue un lingüista norteamericano de mediados del siglo XX que se dedicó a aplicar el análisis estadístico a las lenguas. 


Uno de los estudios que le reportó fama fue el descubrimiento de la ley que lleva su nombre, la "Ley de Zipf", según la cual la frecuencia con la que son utilizadas las palabras siguen una distribución estadística concreta. No entraremos en detalles técnicos de su formulación, pero básicamente nos dice que la palabra más usada en un idioma (the, en inglés) aparece el doble de veces que la segunda más usada (of), y el triple que la tercera, etc. 

Pero esta ley de la frecuencia de las apariciones no ocurre solo con las palabras, su ámbito es mucho mayor. Por ejemplo, en el de las poblaciones de las ciudades de un país: la ciudad más grande suele tener el doble de habitantes que la segunda población de ese país. Y en general es aplicable a la ordenación de  grandes conjuntos de datos... E internetque no deja de ser una base de datos enorme, no podría ser menos, también se puede describir el número de visitas a las páginas individuales de Internet en un intervalo de tiempo dado...

Intrigado, lo he comprobado para este blog (datos de setiembre de 2019) y he aquí los resultados: 

Las desviaciones del número de visitas reales respecto de las calculadas según la ley de Zipf no son muy grandes y seguro que se pueden corregir ajustando los parámetros de la fórmula. Podríamos decir que "cumple" a trazo grueso con la Ley de Zipf

Eso me lleva a plantear algunas cuestiones acerca del significado profundo de la Ley de Zipf...¿Es una mera descripción estadística del comportamiento de los sistemas de información y bases de datos? ¿Los conjuntos de datos siempre se acaban ordenando siguiendo la Ley de Zipf? ¿Es una descripción de la realidad? Lo que --cómo no-- nos lleva a plantearnos una vez más el dilema del azar o el determinismo.
Aunque ya sabemos lo que se dice de las estadísticas...

2 comentarios:

  1. ¡Hola! Te he mencionado en mi blog, sobre el cuál también he realizado el experimento: https://blog.adrianistan.eu/ley-zipf-blog

    La verdad es que sigo tu blog desde hace un tiempo y quiero felicitarte, porque siempre me sorprende con cosas nuevas. Un saludo!

    ResponderEliminar
  2. Muchas gracias Adrián. Vemos que se trata de una ley "universal"....

    ResponderEliminar