[Projets 2025] NAHU² – Juan-Manuel Torres Moreno (LIA) & Graham Ranger (ICTT)
Titre : NAHU² – Unification des graphies des documents textuels en nahuatl et leur modélisation en utilisant l’IA
Équipe :
- Juan-Manuel TORRES MORENO (LIA) – Porteur
- Graham RANGER (ICTT) – Porteur
- Martha Lorena AVENDANO GARRIDO (Université de Veracruz)
- Miguel FIGUEROA-SAAVEFRA RUIZ (Université de Veracruz)
Résumé : Nous cherchons à développer des algorithmes pour unifier les graphies des documents en nahuatl venant à la fois : a/ de sources hétérogènes ; b/ de diverses propositions de graphies et c/ de variantes linguistiques régionales. En effet, les documents sont disponibles en plusieurs formats et codification numériques distinctes (PDF, texte, OCR, utf, isolatin). Également, il y a plusieurs alphabets proposés : franciscain, jésuite, traditionnel, OPINAC, SLI et pratique, et actuellement l’INALI tente de créer une norme orthographique unifiée et aussi l’Univ. Veracruzana dans ses propes processus éducatifs et administratifs. Enfin, il y a au moins 4 régions (Centrale, Nord, Pacifique, Golfe du Mexique) où le nahuatl a évolué et suivi des chemins différents (les vocabulaires ne sont pas les mêmes, et leurs caractéristiques grammaticales distinctes bien qu’ils partagent une structure grammaticale commune, ce qui complique le développement de corpus adéquats pour un traitement informatique. Nous voulons construire un système d’unification des graphies, pré-traitement indispensable pour la constitution de corpus. Nous nous appuierons sur la combinaison de TAL, RI, ainsi que sur l’IA profonde.
Voir aussi : Projet Nahua – Projet Nawa
Instrument : Projet blanc
Identifiant : 25-BLC-2


