El Octavo Pasajero: 27 de junio de 2013

El misterioso y bello texto de Voynich, datado en el siglo XV y que muchos investigadores han considerado recientemente como un galimatías, podría no tratarse de un fraude después de todo. Un nuevo estudio de la Universidad de Manchester sugiere que el texto comparte bastantes características con lenguas auténticas, así como que podría contener mensajes codificados. Para alcanzar esta conclusión, el equipo científico ha manejado un sistema que analiza la entropía de las palabras empleadas en el manuscrito y la pone en relación con sistemas similares de otros lenguajes ya existentes.

La afirmación acerca de la posible existencia de un idioma secretosurge del empleo de una técnica estadística que pone una cifra en la información contenida por los elementos de un texto o código, incluso si su significado es desconocido. Esta técnica también podría ser empleada para determinar si hay un significado en los genomas, posibles mensajes alienígenas, e incluso para esclarecer las señales entre las neuronas en el cerebro.

El manuscrito de Voynich ha confundido y fascinado a partes iguales a los investigadores desde que el vendedor de libros Wilfred Voynich lo encontró en un monasterio italiano en 1912. El texto contiene ilustraciones de ninfas desnudas, plantas inidentificables, diagramas astrológicos y páginas y páginas de texto escrito en un alfabeto no identificado.

Aunque el patrón de longitud de las palabras y de la combinación de signos en el texto es similar a otros de lenguas conocidas, varios estudios recientes sugerían que el libro era un claro fraude del siglo XV,diseñado para timar a los coleccionistas de libros del Renacimiento, y que las palabras no tenían significado. Un trabajo científico mostraba, incluso, que técnicas ya conocidas de los criptógrafos del siglo XVI podrían haber permitido que alguien creara estos patrones utilizando un conjunto sin sentido de caracteres. Otro estudio concluía que las propiedades estadísticas de la escritura eran coincidentes con un galimatías.

Entropía de las palabras

Ahora, Marcelo Montemurro, de la Universidad de Manchester (Gran Bretaña), ha analizado el texto junto a otros colegas, utilizando una técnica que retira la mayoría de los términos con significado. “Decidimos que era la fórmula ideal para analizar este misterioso manuscrito –afirma Montemurro-. La gente ha estado discutiendo y discrepando durante décadas si se trataba de un engaño, así que esta nueva técnica podría permitir un acercamiento a la verdad”.

Sus resultados convalidan la idea de que el texto de Voynich contiene realmente un lenguaje secreto. Más allá de buscar patrones en las propias palabras, el método de Montemurro persigue más un patrón global en la frecuencia y el agrupamiento de las palabras que podría producir un significado. “Los resultados que conseguimos gracias a esta búsqueda arrojan una nueva luz sobre el contenido del volumen”, indica.

El método emplea una fórmula para encontrar la entropía de cada término, lo que supone una medida sobre cómo de frecuente es su utilización en el texto. Para uno de estos términos, los investigadores determinan su entropía en el texto original y en una versión mezclada de él. La diferencia entre las dos entropías, multiplicada por la frecuencia de la palabra, da la medida de cuánta información aporta.

El procedimiento reconoce que las palabras que son particularmente importantes aparecerán más frecuentemente, al tiempo que hace una distinción entre las palabras con un nivel bajo de información, como ‘y’, que aparecen por doquier en el texto, y las que aportan un nivel alto de información, como ‘idioma’, que podrían aparecer sólo en las áreas del texto en las que se aborde esa cuestión.

Marcadores de relación

Volviendo al origen de este trabajo en el año 2009, el acercamiento por medio de la entropía se centró en las palabras con significado en textos famosos de varios idiomas. En ‘El origen de las especies’, por ejemplo, las 10 palabras más informativas identificadas por esta fórmula incluían ‘especies’, ‘variedades’, ‘híbridos’, ‘formas’ y ‘géneros’. En ‘Moby Dick’, una de las palabras más importantes según este procedimiento era ‘ballena’.

Cuando se aplicó al texto de Voynich, la fórmula tomó varias palabras con una alta entropía que parecían ser específicas de diferentes secciones del manuscrito. El equipo también aplicó un análisis más exhaustivo del que se deducía cómo se relacionaban las palabras desconocidas, basándose en cómo lo hacían las agrupaciones de palabras en lenguas conocidas. A partir de ahí aplicaron estos marcadores de relación para comparar las diferentes partes del texto.

Siguiendo este método, el equipo encontró que los términos con una alta entropía en la sección que por sus ilustraciones parecía tratar de temas farmacéuticos y herbales eran más fáciles de relacionar con otros que los términos que aparecían en secciones sobre astrología, biología y fórmulas. “Eran los más fuertemente conectados lingüísticamente y también al nivel de sus representaciones pictóricas, puesto que sólo hay dos secciones en las que aparezcan estas plantas –explica Montemurro-. Nuestro análisis es el primero que, de hecho, relaciona, estas secciones a partir de su estructura lingüística exclusivamente”.

Agrupaciones de palabras

La técnica también medía la mejor manera de agrupar las palabras seleccionadas para maximizar su valor informativo. En novelas o capítulos que pertenecían a ciertos tópicos, las agrupaciones de los términos elegidos por su alta entropía tendían a ser bastante grandes, ya que contenían varios cientos de palabras. En contra de esto, en los libros que eran simplemente una lista de notificaciones, es decir, cuyas partes se presentaban sin ninguna conexión entre ellas, las agrupaciones de palabras –conocidas como escalas dominantes- podían ser mucho más pequeñas.

Montemurro y su equipo compararon las escalas dominantes en el manuscrito Voynich con las existentes en textos de un tamaño similar en varias lenguas distintas: en ‘El origen de las especies’ (en inglés), ‘Los archivos del Gran Historiador’ (en chino), las ‘Confesiones de San Agustín’ (en latín), más el código informático del lenguaje de programación Fortran y algunas secciones del código del ADN.

La escala dominante de las lenguas humanas tiene un tamaño de entre 500 y 700 palabras, mientras que la de Fortran se sitúa en torno a 300, y la del ADN sobre 10. Para el texto de Voynich era de unas 800. “Buscábamos ver si la estructura que emergía del análisis podía ser tan consistente como la de un idioma real –confiesa Montemurro-. Si hubiéramos dado con algo como el código del ADN, las conclusiones habrían arrojado más dudas sobre la naturaleza del manuscrito, pero dados los valores que obtuvimos, afirmamos que no puede descartarse que se trate de una lengua”.

Los defensores de la hipótesis sobre que se trata de un fraude no están convencidos todavía por estos hallazgos. En 2004, el científico informático Gordon Rugg, de la Keele Univertsity de Gran Bretaña, propuso un método de baja exigencia tecnológica por el que un bromista inteligente podría haber creado el manuscrito de Voynich completo sin haber inventado un idioma secreto previamente.

Un chiste viable

El ‘chistoso’ podría haber escrito primero una tabla de sílabas de galimatías en la que se incluyeran las raíces, prefijos y sufijos encontrados en el texto de Voynich, para después cubrirla con una carta con tres agujeros que desplazaría sobre su superficie para encontrar las ‘nuevas’ palabras. Empleando varias cartas diferentes con distintas disposiciones de los agujeros, se produce un texto que tendría la apariencia de un idioma, aunque no lo sea.

“El chiste es perfectamente viable”, afirma Rugg, y podría producir varias de las características que Montemurro encontró en las distribución de palabras del manuscrito Voynich. “La aparición de una estructura compleja no tiene por qué haber sido producida por una estructura interna compleja. Hay muchos procesos simples que generan resultados de mucha complejidad”.

El especialista en computación añade que este esfuerzo podría estar justificado por la sofisticación de los coleccionistas de libros de esa época, que podrían haber sometido el texto a algunos test antes de adquirirlo. Rugg también apunta que el manuscrito no muestra evidencias de errores que hayan sido cometidos durante la escritura. “Si el manuscrito de Voynich es una muestra un idioma real, o la persona que lo escribió no se preocupó de si estaba cometiendo errores, o escribió 200 páginas sin cometer ni uno solo de ellos, lo que es bastante improbable”, afirma.

Montemurro espera ahora poder analizar otras secuencias que aporten información no necesariamente lingüística, como el ADN o quizás incluso las señales neuronales. Esto podría ayudar a los genetistas a centrarse en los tramos más valiosos del ADN y revelar si las diferentes partes del cerebro ‘hablan con otras por medio de un código. “Pero elmanuscrito de Voynich genera esta fascinación porque, por una única vez, no tenemos una conclusión sobre su significado”, admite Rugg. “Es como si a la historia de misterio más interesante de todos los tiempos alguien le hubiera arrancado las tres últimas páginas”, concluye.

jueves, 27 de junio de 2013

Científicos hallan indicios de un idioma secreto en el Manuscrito Voynich