El misterioso y
bello texto de Voynich, datado en el siglo XV y que muchos
investigadores han considerado recientemente como un galimatías, podría no
tratarse de un fraude después de todo. Un nuevo estudio de la Universidad de
Manchester sugiere que el texto comparte bastantes características con lenguas
auténticas, así como que podría contener mensajes codificados. Para
alcanzar esta conclusión, el equipo científico ha manejado un sistema que
analiza la entropía de las palabras empleadas en el manuscrito y la pone en
relación con sistemas similares de otros lenguajes ya existentes.
La afirmación
acerca de la posible existencia de un idioma secretosurge del
empleo de una técnica estadística que pone una cifra en la información
contenida por los elementos de un texto o código, incluso si su significado es
desconocido. Esta técnica también podría ser empleada para determinar si hay un
significado en los genomas, posibles mensajes alienígenas, e incluso para
esclarecer las señales entre las neuronas en el cerebro.
El manuscrito
de Voynich ha confundido y fascinado a partes iguales a los
investigadores desde que el vendedor de libros Wilfred Voynich lo encontró en
un monasterio italiano en 1912. El texto contiene ilustraciones de ninfas
desnudas, plantas inidentificables, diagramas astrológicos y páginas y
páginas de texto escrito en un alfabeto no identificado.
Aunque el patrón
de longitud de las palabras y de la combinación de signos en el texto es
similar a otros de lenguas conocidas, varios estudios recientes sugerían que el
libro era un claro fraude del siglo XV,diseñado para timar a los
coleccionistas de libros del Renacimiento, y que las palabras no tenían
significado. Un trabajo científico mostraba, incluso, que técnicas ya conocidas
de los criptógrafos del siglo XVI podrían haber permitido que alguien creara
estos patrones utilizando un conjunto sin sentido de caracteres. Otro estudio
concluía que las propiedades estadísticas de la escritura eran coincidentes con
un galimatías.
Entropía de las palabras
Ahora, Marcelo
Montemurro, de la Universidad de Manchester (Gran Bretaña), ha analizado el
texto junto a otros colegas, utilizando una técnica que retira la mayoría de
los términos con significado. “Decidimos que era la fórmula ideal para analizar
este misterioso manuscrito –afirma Montemurro-. La gente ha estado discutiendo
y discrepando durante décadas si se trataba de un engaño, así que esta nueva
técnica podría permitir un acercamiento a la verdad”.
Sus resultados
convalidan la idea de que el texto de Voynich contiene realmente un
lenguaje secreto. Más allá de buscar patrones en las propias palabras, el
método de Montemurro persigue más un patrón global en la frecuencia y
el agrupamiento de las palabras que podría producir un significado. “Los
resultados que conseguimos gracias a esta búsqueda arrojan una nueva luz sobre
el contenido del volumen”, indica.
El método emplea
una fórmula para encontrar la entropía de cada término, lo que supone una
medida sobre cómo de frecuente es su utilización en el texto. Para uno de estos
términos, los investigadores determinan su entropía en el texto original y en
una versión mezclada de él. La diferencia entre las dos entropías, multiplicada
por la frecuencia de la palabra, da la medida de cuánta información aporta.
El procedimiento
reconoce que las palabras que son particularmente importantes aparecerán más
frecuentemente, al tiempo que hace una distinción entre las palabras con un
nivel bajo de información, como ‘y’, que aparecen por doquier en el texto, y
las que aportan un nivel alto de información, como ‘idioma’, que podrían
aparecer sólo en las áreas del texto en las que se aborde esa cuestión.
Marcadores de relación
Volviendo al
origen de este trabajo en el año 2009, el acercamiento por medio de la entropía
se centró en las palabras con significado en textos famosos de varios idiomas.
En ‘El origen de las especies’, por ejemplo, las 10 palabras
más informativas identificadas por esta fórmula incluían ‘especies’,
‘variedades’, ‘híbridos’, ‘formas’ y ‘géneros’. En ‘Moby Dick’, una
de las palabras más importantes según este procedimiento era ‘ballena’.
Cuando se aplicó
al texto de Voynich, la fórmula tomó varias palabras con una alta entropía que
parecían ser específicas de diferentes secciones del manuscrito. El equipo
también aplicó un análisis más exhaustivo del que se deducía cómo se
relacionaban las palabras desconocidas, basándose en cómo lo hacían las
agrupaciones de palabras en lenguas conocidas. A partir de ahí aplicaron estos marcadores
de relación para comparar las diferentes partes del texto.
Siguiendo este
método, el equipo encontró que los términos con una alta entropía en la sección
que por sus ilustraciones parecía tratar de temas farmacéuticos y herbales eran
más fáciles de relacionar con otros que los términos que aparecían en secciones
sobre astrología, biología y fórmulas. “Eran los más fuertemente
conectados lingüísticamente y también al nivel de sus representaciones
pictóricas, puesto que sólo hay dos secciones en las que aparezcan estas
plantas –explica Montemurro-. Nuestro análisis es el primero que, de hecho,
relaciona, estas secciones a partir de su estructura lingüística
exclusivamente”.
Agrupaciones de palabras
La técnica
también medía la mejor manera de agrupar las palabras seleccionadas para
maximizar su valor informativo. En novelas o capítulos que pertenecían a
ciertos tópicos, las agrupaciones de los términos elegidos por su alta entropía
tendían a ser bastante grandes, ya que contenían varios cientos de palabras. En
contra de esto, en los libros que eran simplemente una lista de notificaciones,
es decir, cuyas partes se presentaban sin ninguna conexión entre ellas, las
agrupaciones de palabras –conocidas como escalas dominantes- podían ser mucho
más pequeñas.
Montemurro y su
equipo compararon las escalas dominantes en el manuscrito Voynich con las
existentes en textos de un tamaño similar en varias lenguas distintas: en ‘El
origen de las especies’ (en inglés), ‘Los archivos del Gran Historiador’ (en
chino), las ‘Confesiones de San Agustín’ (en latín), más el código informático
del lenguaje de programación Fortran y algunas secciones del código del ADN.
La escala
dominante de las lenguas humanas tiene un tamaño de entre 500 y 700 palabras,
mientras que la de Fortran se sitúa en torno a 300, y la del ADN sobre 10. Para
el texto de Voynich era de unas 800. “Buscábamos ver si la estructura que
emergía del análisis podía ser tan consistente como la de un idioma real
–confiesa Montemurro-. Si hubiéramos dado con algo como el código del ADN, las
conclusiones habrían arrojado más dudas sobre la naturaleza del manuscrito,
pero dados los valores que obtuvimos, afirmamos que no puede descartarse que se
trate de una lengua”.
Los defensores de
la hipótesis sobre que se trata de un fraude no están convencidos todavía por
estos hallazgos. En 2004, el científico informático Gordon Rugg, de la Keele
Univertsity de Gran Bretaña, propuso un método de baja exigencia tecnológica
por el que un bromista inteligente podría haber creado el manuscrito de
Voynich completo sin haber inventado un idioma secreto previamente.
Un chiste viable
El ‘chistoso’
podría haber escrito primero una tabla de sílabas de galimatías en la que se
incluyeran las raíces, prefijos y sufijos encontrados en el texto de Voynich,
para después cubrirla con una carta con tres agujeros que desplazaría sobre su
superficie para encontrar las ‘nuevas’ palabras. Empleando varias cartas
diferentes con distintas disposiciones de los agujeros, se produce un texto que
tendría la apariencia de un idioma, aunque no lo sea.
“El chiste es
perfectamente viable”, afirma Rugg, y podría producir varias de las
características que Montemurro encontró en las distribución de palabras del
manuscrito Voynich. “La aparición de una estructura compleja no tiene por qué
haber sido producida por una estructura interna compleja. Hay muchos procesos
simples que generan resultados de mucha complejidad”.
El especialista
en computación añade que este esfuerzo podría estar justificado por la
sofisticación de los coleccionistas de libros de esa época, que podrían haber
sometido el texto a algunos test antes de adquirirlo. Rugg también apunta que
el manuscrito no muestra evidencias de errores que hayan sido cometidos durante
la escritura. “Si el manuscrito de Voynich es una muestra un idioma real, o la
persona que lo escribió no se preocupó de si estaba cometiendo errores, o
escribió 200 páginas sin cometer ni uno solo de ellos, lo que es bastante
improbable”, afirma.
Montemurro espera
ahora poder analizar otras secuencias que aporten información no necesariamente
lingüística, como el ADN o quizás incluso las señales neuronales. Esto podría
ayudar a los genetistas a centrarse en los tramos más valiosos del ADN y
revelar si las diferentes partes del cerebro ‘hablan con otras por medio de un
código. “Pero elmanuscrito de Voynich genera esta fascinación
porque, por una única vez, no tenemos una conclusión sobre su significado”,
admite Rugg. “Es como si a la historia de misterio más interesante de todos los
tiempos alguien le hubiera arrancado las tres últimas páginas”, concluye.