Presentación
El banco de árboles morfosintácticos Egipcio Pre-Copto (EPC) es el primer banco lingüístico creado para la anotación morfosintáctica de textos egipcios pre-coptos. Fue creado en marzo de 2024 en Universal Dependencies (UD) y apareció publicado, por primera vez, en la edición de UD de mayo de 2024 (2.14) en la que contenía 5.515 signos y 707 oraciones. Actualmente, el banco morfosintáctico EPC consta de más de 30.000 signos y 3.000 oraciones en la edición de UD de mayo de 2026 (2.18). Todas estas oraciones proceden de los Textos de las Pirámides, el corpus de ensalmos recitados durante los ritos funerarios de los reyes y reinas del Reino Antiguo (ca. 2543-2120 a. C.).
El objetivo del banco morfosintáctico EPC es anotar propiedades morfológicas y las relaciones sintácticas de los textos más representativos del egipcio del Reino Antiguo y Reino Medio, egipcio clásico, neoegipcio y demótico (v. la selección de textos en Díaz Hernández, Passarotti: 2024). Las oraciones analizadas en el banco morfosintáctico EPC constan de 16 secciones: sent_id, title, edition, spell, section, king, date, lang, genre, place, TLA, text, lit, trans, type y comment. El banco morfosintáctico EPC se publica sin las secciones lit, trans, type y comment, pues necesitan revisarse antes de su publicación. Las palabras de cada oración se analizan en diez columnas siguiendo la metodología de Universal Dependencies:
Columna 1: Posición de la palabra en la oración.
Columna 2: Forma de la palabra en la oración.
Columna 3: Lema de la palabra.
Columna 4: Categoría gramatical de la palabra en lingüística universal.
Columna 5: Categoría gramatical de la palabra en una lengua específica.
Columna 6: Propiedades morfológicas.
Columna 7: Palabra gobernante.
Columna 8: Relación sintáctica.
Columna 9: Relación sintáctica específica.
Columna 10: Grafías jeroglíficas, clasificadores y códigos de las palabras.
Las columnas 5 y 9 no se anotan por ser irrelevantes para el banco morfosintáctico EPC.
La aplicación de la metodología de Universal Dependencies a la lengua egipcia se explica en esta página de Universal Dependencies que redacté en abril de 2024.
Antes de la creación del banco morfosintáctico EPC no existía ninguna aplicación digital para el estudio de la morfosintaxis del egipcio pre-copto. Además, tiene una variada gama de aplicaciones en lingüística computacional, pues ha sido utilizado hasta ahora para la creación o el desarrollo de las siguientes aplicaciones de lenguaje procesado:
1) GrewPT, una aplicación digital para el análisis de la lengua y escritura egipcias de los Textos de las Pirámides.
2) El Analizador EPC que sirve para analizar automáticamente la morfosintaxis de las oraciones egipcias. Ofrece la posibilidad de crear diagramas de árboles morfosintácticos para su uso en trabajos didácticos y científicos.
3) El repositorio PARSEME de expresiones poliléxicas egipcias. Este repositorio está desarrollado por el grupo de investigación de egipcio de PARSEME en la Universidad de Jaén.
4) El buscador de palabras egipcias de ORAEC.
Además, se usa como recurso lingüístico para la lengua egipcia en páginas de lingüística computacional de reconocido prestigio internacional como, por ejemplo, TüNDRA y UDPipe.
El banco morfosintáctico EPC se originó durante la acción COST UniDive (CA21167) financiada por la Unión Europea desde 2022 hasta 2026. Me gustaría expresar mi agradecimiento a Daniel Zeman, Bruno Guillaume y Marco Passarotti por su apoyo en la creación y desarrollo del banco morfosintáctico EPC.
Para cualquier duda o consulta, póngase en contacto con el iniciador y principal desarrollador del banco morfosintáctico EPC: Roberto A. Díaz Hernández, Investigador "Beatriz Galindo" en Historia Antigua, Facultad de Humanidades, Universidad de Jaén (radiaz@ujaen.es)