Recurren a IA para mantener “vivas” lenguas originarias de México
Agencia de Noticias TV (UNAM), 15 de marzo de 2026
Para preservar y contar con un registro digital de las lenguas nacionales, especialistas del Departamento de Ciencias de la Computación del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas de la UNAM, utilizan inteligencia artificial.
“Esta herramienta ayudará a que permanezcan vivas, aunque sea de manera artificial, pues muchas de ellas carecen de hablantes”, explicó el investigador de esa entidad universitaria, Iván Vladimir Meza Ruiz.
En México existen 68 lenguas nacionales, 11 familias y 364 variantes lingüísticas; muchas están cayendo en desuso y se dirigen a la extinción, alertó el experto.
Del 15 por ciento de hablantes de nuestro país que había en 1930, disminuyó a 6.2 por ciento de la población nacional en 2020; además, quienes las utilizan son, en su mayoría, personas mayores, mientras que las generaciones más jóvenes casi no las practican, refirió.
Ponente en la sexta sesión de la Cátedra Extraordinaria de Bioética, organizada por el Programa Universitario de Bioética (PUB) de esta casa de estudios, Meza Ruiz expuso a distancia el tema “Inteligencia artificial y lenguas originarias de México”.
Ante Carol Hernández Rodríguez, moderadora y coordinadora del evento, el especialista en la intersección entre el lenguaje humano y el cómputo reconoció que tecnológicamente saben cómo crear versiones paralelas de forma masiva y digital, pero dependen de reunir suficiente información.
De acuerdo con Meza Ruiz, se carece de datos masivos de las lenguas originarias de México. Según Wikipedia, del náhuatl clásico solamente existen cuatro mil 272 artículos; maya yucateco, mil 201; náhuatl central, 224; mixteco, 113; hñahñu, 90; purépecha, 12; y mixe del norte, 10.
Reveló que se enfrentan a un dilema ético, pues a partir de un ejercicio académico existe preferencia por la ciencia abierta y numerosas obras y documentos en estas lenguas están sujetas a autoría, tienen derechos morales y patrimoniales.
De igual forma, consideró que una estrategia digital ayudaría a comunidades hablantes a tener acceso a salud, justicia, educación, autonomía económica y a una lectura y plática en sus lenguas. En nuestro país, varias de estas son orales y por ello existen menos registros, pues enfrentan una problemática de dato biométrico.
“Los datos existentes están sesgados hacia la música y hay escasos registros del habla, la cual es además un punto de contacto para la discriminación”, señaló.
A decir del universitario, las lenguas originarias en nuestra nación no están bien representadas en términos de datos lingüísticos. El siguiente trabajo es crear el ecosistema para recolectarlos, y así poderlas conservar digitalmente.

