Investigadores de la Universidad Nacional Autónoma de México (UNAM) realizaron un estudio en el que muestran por primera vez la forma en que ha evolucionado la frecuencia del uso de las palabras a lo largo de los tres últimos siglos.
Con el uso de herramientas de la física, matemáticas, estadística y de cómputo, los especialistas realizaron su investigación para los idiomas inglés, alemán, español, francés, italiano y ruso; sus hallazgos fueron publicados en la revista electrónica de reconocimiento internacional, PLOS ONE.
En este proyecto participaron Germinal Cocho, Jorge Flores y Carlos Pineda, del Instituto de Física (IF), Carlos Gershenson, del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS), y Sergio Sánchez, de la Facultad de Ciencias (FC).
Carlos Pineda explicó que el propósito del proyecto es el estudio de las variaciones en el lenguaje; para ello, aprovecharon el proceso de escaneo masivo de libros de todo el mundo desde 1508 hasta 2012 emprendido por la plataforma Google.
“No sólo tenemos un corte en el tiempo de cómo es el lenguaje de hoy, sino cómo se ha modificado. Estudiamos aspectos básicos, pues somos físicos y no lingüistas; vemos cuáles fueron las 100 mil palabras más usadas cada año, a fin de determinar los cambios”, indicó en un comunicado.
Resaltó que a pesar de las grandes revoluciones culturales y de que Alemania, por ejemplo, es muy diferente a Latinoamérica, todas las palabras, en los distintos idiomas.
“Parecen seguir un patrón similar: a mayor uso de una, ésta tiene menor variable de rango, mientras que a menor empleo, su cambio en el rango es mayor. Ese esquema fue nuestro principal hallazgo. Además, logramos modelarlo a partir de un caminante aleatorio”, explicó.
Dio a conocer que entre los 20 sustantivos más empleados en el año 1700 para el español destacan Dios, rey, cardenal y fe, mismos que en el 2000 fueron sustituidos por vocablos como parte, Estado, años, vida y nacional, entre otras.
El modelo que desarrollaron los investigadores universitarios permitió determinar tres regímenes diferentes: cabeza, es decir, palabras estructurales más comunes.
Así como cuerpo, que comprende los vocablos de uso general, aquellos que se requieren para establecer una comunicación entre dos personas o para contar con un conocimiento básico del lenguaje, tal y como lo determinaron los lingüistas y, finalmente, la cola, que comprende términos más especializados.
La idea utilizada para modelar los cambios del rango de las palabras en el tiempo es una caminata aleatoria, en la que se escoge al azar el tamaño del siguiente paso, pero con cierta desviación estándar que indica qué tanto puede variar el paso.
En este caso la desviación estándar o tamaño del paso es proporcional al rango, es decir, mientras más alto el rango o menor uso de una palabra, potencialmente se moverá a más lugares de manera aleatoria cada año y las palabras más usadas o intervalos menores tienen pasos tan pequeños que en la práctica se mueven poco o nada.
El investigador dio como ejemplo el artículo en inglés the, como de bajo rango, pues su uso es frecuente y así se ha mantenido en todos los momentos de la historia; no hay cambios significativos.
“Lo que hicimos fue tomar una rebanada en el tiempo para determinar cuántas palabras diferentes estaban en el puesto 1713, por ejemplo; quizá en esa posición podría haber una o dos palabras, o bien, hasta 100”, comentó.
Detalló que mientras más pequeño sea el rango inicial, las variaciones son menores, pero entre más alto sea, incrementan porque las palabras cambian con mayor facilidad.
“Los lingüistas han estimado que existe un cuerpo de palabras común en todos los idiomas; un conjunto de uso frecuente que posibilita una comunicación básica que va desde las mil 500 a las tres mil palabras. Éste es el primer modelo que lo confirma”, planteó Pineda Santamaría.
Otra de las aportaciones del estudio de la evolución de las palabras es la posibilidad de hacer algunas predicciones estadísticas que podrían proporcionar información a los lingüistas.