En el “Brown University Standard Corpus”, texto de 1960 que contiene alrededor de dos millones de palabras de texto, la palabra “of” es la cuarta más usada. Por otro lado, la palabra “the” es la palabra escrita más usada en la lengua de Shakespeare, seguida de otras como: “be”, “on”, “have”, “with” y “some”; todas ellas palabras muy cortas.
Sin embargo, científicos cognitivos del MIT han revelado una mejora sustancial de la ley Zipf. Han demostrado que, en unas 10 lenguas, la previsibilidad de lo que una persona dice se ve más influenciado por la longitud de la palabra que la frecuencia con la que esa persona la usa. Esto es así, porque la longitud de una palabra es inversamente proporcional a la cantidad de información que contiene.
De esta forma, el objetivo de la investigación era relacionar la teoría de la frecuencia de las palabras de Zipf con la previsibilidad de una palabra y su longitud.
Utilizando una base de datos enorme, los investigadores estudiaron todas las posibles combinaciones de dos, tres y cuatro palabras con idea de estimar como de previsible es su utilización. Conociendo esto podrían determinar si el contexto y la previsibilidad son más determinantes que la frecuencia de uso, en el tamaño de la palabra.
Sus conclusiones fueron que la frencuencia con las que usamos las palabras es un mejor predictor que la longitud de éstas. Tal y como afirmaSteven Piantadosi, unos de los investigadores del MIT:
Me sorprendió que encontráramos este efecto en tantos idiomas: checo, holandés, inglés, francés, español, sueco, etc. Pensaba que las diferencias en la morfología, estructura de las palabras, etc. podrían modificar este hecho.
Publicar un comentario