ChatGPT, una nueva herramienta para la interpretación de textos antiguos

Dos son los temores que acosan al estudiante lego en historia, como es mi caso. A saber, la paleografía y el latín. La paleografía es la ciencia auxiliar dedicada a entender caligrafías antiguas, que tanto han evolucionado desde los albores de la escritura hasta nuestros día
abril 1, 2023

Ignasi Belda, Universitat Internacional de Catalunya

Dos son los temores que acosan al estudiante lego en historia, como es mi caso. A saber, la paleografía y el latín. La paleografía es la ciencia auxiliar dedicada a entender caligrafías antiguas, que tanto han evolucionado desde los albores de la escritura hasta nuestros días.

Desde luego, en nuestro entorno geográfico la caligrafía ha experimentado una notable evolución desde las inscripciones romanas hasta la modernidad, pasando por la letra visigótica, la carolina, la letra de albalaes o, peor aún, la procesal ligada o letra del diablo.

El latín es la otra barrera que deben superar los estudiantes de historia. En la actualidad existen buenas herramientas digitales, como la archiconocida “Google Translate”, capaz de proporcionar traducciones más que aceptables entre casi cualquier par de lenguas, incluida el latín.

Sin embargo, la complejidad se torna en imposibilidad cuando el principiante intenta usar este tipo de herramientas para traducir del latín a su lengua textos antiguos transcritos por él. Textos que, probablemente, estarán salpicados de multitud de incorrecciones por no saber latín ni tener el ojo aún hecho a la caligrafía antigua.

Por otra parte, en las últimas semanas hemos asistido a una explosión de artículos, incluso en este medio, de nuevas aplicaciones que se le han encontrado al flamante ChatGPT (GPT-3), una herramienta de inteligencia artificial de lenguaje que crea y procesa textos.

Hemos visto cómo GPT-3 intentaba imitar a Lorca, hemos comprobado que hubiera aprobado las pruebas de acceso a la universidad en historia y hemos visto que amenaza muchas profesiones actuales. Y, aunque GPT-3 no se acerca a Lorca ni aprobaría la selectividad con una matrícula de honor, debemos reconocer sus méritos.

Traduciendo e interpretando latín

Habiendo presentado el problema y la herramienta, este autor ha puesto nuevamente a prueba GPT-3 con un documento de 1601, en latín, encontrado en el Archivo Histórico Municipal de Cocentaina (Alicante).

El documento, escrito en una variante caligráfica de la tipografía humanista cursiva, muy cursivizada, presenta una escritura notarial.

GPT-3, al menos de momento, no reconoce imágenes. Por tanto, la labor del investigador novel ha sido transcribir con su nulo conocimiento de la lengua latina las 29 páginas que componen el documento. Esta sería la transcripción, siguiendo las normas básicas de la paleografía, de la primera página (ver imagen):

/1 Die xii Aprilis anno /2 ano “facultate” D.n M D C primo /3 In deus nomine Amen no verim uni- /4verci quod nos Josephus Pachell, Justicia /5 anno presenti ville de baronie /6 de Benilloba: Michael Adori, /7 Geronimus Alominet, dictus lo roig, /8 et Josephus “Mughaist” jurati Hyero- /9nimus Sala “adilés”, PEtrus Pachell, /10 Michael Pachell, lo casntenintibus /11 Justicie, Hyeronimus Melich, Pe- /12trus Adari, Petros Doret, Hyeroni- /13mus Adari, Michael Palomo, /14 Petrus Bay Banet, Hyeronimus /15 Array, Michel Bardaner, Michael /16 Faquinet, Bartolomus Array, Hy- /17eronimus Mugit, Jacobus Alaminet, /18 Geneceiy Aliques dictum Minor, /

Una vez transcrito todo el texto, se ha pasado a ChatGPT y se le han dado las siguientes instrucciones:

  1. Quitar las barras y los números.
  2. Juntar las palabras separadas por guiones.
  3. Traducir del latín al español.

A partir de aquí, sin ninguna dilación el sistema ha empezado con la tarea, completándola en menos de un minuto. No analizaremos el texto traducido íntegramente, pero sí queremos mostrar la traducción de una línea para que el lector pueda observar hasta dónde llega la potencia de la máquina.

En esta línea (1ª línea de la 4ª página), he transcrito esta frase: “/1 de Menis joatorem generalem /2”. En realidad, lo transcrito no tiene ningún sentido, es decr, “de Menis joatorem” no significa nada en latín. Pero GPT-3 entiende que donde dice “de Menis joatorem” probablemente deba decir “administratorem”. En base a esto, lo traduce como “gobernador general”.

En efecto, preguntando a expertos en paleografía, lo correcto sería “/1 Administratorem generalem /2”, que GPT-3 ha interpretado correctamente simplemente entendiendo el contexto donde se enmarca la mala transcripción del estudiante.

Una vez interpretada la transcripción íntegra por parte de GPT-3, el investigador puede observar que estamos ante un caso bastante singular.

Ante una hambruna sin precedentes, el documento refleja un acto jurídico a través del cual se inviste a un representante popular, don Pedro Pachell, nuevo converso, con plenos poderes para que venda o enajene todos los bienes muebles o inmuebles del pueblo para conseguir dinero con el fin de adquirir cereales.

Se establece que el representante plenipotenciario puede vender incluso casas, tiendas, tierras cultivadas e incultas, y todos los ingresos y beneficios, así como también la generación de ingresos. En fin, el documento refleja una clara situación de desesperación por parte de los habitantes de Benilloba que, ante tal panorama, deciden “vender” el pueblo al mejor postor.

Sin duda, por la extensión del texto, su grafía antigua y su escritura en latín, éste hubiera sido completamente inaccesible para el neófito si no hubiera sido por la ayuda prestada por GPT-3.

De hecho, GPT-3 basa sus respuestas en un modelo de lenguaje probabilístico y, según el contexto en el que se encuentra, como una mente humana, lo interpreta y lo hace tolerante a los fallos o errores que pueda tener en sus entradas. ¡He aquí la gran potencia que otorga esta nueva herramienta a los legos en el estudio de la historia!


Ignasi Belda, Profesor en biomedicina. Doctor en inteligencia artificial. Doctor en derecho. Doctorando en historia., Universitat Internacional de Catalunya

Este artículo fue publicado originalmente en The Conversation. Lea el original.

Boletín DK