/ miércoles 29 de marzo de 2023

La diversidad del español, pone en aprietos a la IA

Expertos de la Real Academia de la Lengua debaten sobre la riqueza del lenguaje, mismo que la tecnología no puede enfrentar

La inteligencia artificial necesitará mucho "alimento" para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Este fue uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves, donde se habló sobre inteligencia artificial y el largo trecho que tienen que recorrer las máquinas y la tecnología.

Te puede interesar: La Inteligencia Artificial podría ser machista

En el encuentro, el alcalde de la ciudad anfitriona, José María González Santos, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", expresó Kichi.

Esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Al respecto, Virginia Bertolotti, lingüista uruguaya, dijo: "Esto es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer.

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

Se necesitan herramientas más eficaces en lenguaje | Pixabay

Correctores incorrectos

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

"El posicionar al español en el núcleo central de la Inteligencia Artificial (IA), o en el metaverso, es un riesgo", indicó el ministro español de Asuntos Exteriores, José Manuel Albares, y advirtió que, "muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

Te puede interesar: Las máquinas no podrán ser conscientes

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley. Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística.

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

El problema del modelo de lenguaje

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó Gómez-Pérez.

➡️ Suscríbete a nuestro Newsletter y recibe las notas más relevantes en tu correo

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.


La inteligencia artificial necesitará mucho "alimento" para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Este fue uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves, donde se habló sobre inteligencia artificial y el largo trecho que tienen que recorrer las máquinas y la tecnología.

Te puede interesar: La Inteligencia Artificial podría ser machista

En el encuentro, el alcalde de la ciudad anfitriona, José María González Santos, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", expresó Kichi.

Esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Al respecto, Virginia Bertolotti, lingüista uruguaya, dijo: "Esto es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer.

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

Se necesitan herramientas más eficaces en lenguaje | Pixabay

Correctores incorrectos

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

"El posicionar al español en el núcleo central de la Inteligencia Artificial (IA), o en el metaverso, es un riesgo", indicó el ministro español de Asuntos Exteriores, José Manuel Albares, y advirtió que, "muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

Te puede interesar: Las máquinas no podrán ser conscientes

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley. Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística.

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

El problema del modelo de lenguaje

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó Gómez-Pérez.

➡️ Suscríbete a nuestro Newsletter y recibe las notas más relevantes en tu correo

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.


Sociedad

CNTE estallará paro nacional indefinido el 15 de mayo

La CNTE asegura que en su última reunión con el presidente de México, solo puso trabas para atender su demandas, por lo que ahora preparan una movilización

Justicia

Homicidio del periodista Roberto Figueroa podría estar relacionado con su labor: Fiscal de Morelos

Uriel Carmona Gándara, fiscal de Morelos, informó que el asesinato del periodista está relacionado con su labor y poseen datos que los obligan a investigar en esa línea

Mundo

Ecuador demanda a México ante la CIJ por dar asilo a Jorge Glas

La contrademanda de Ecuador responde a una demanda inicial presentada por México por la irrupción a su embajada en Quito el pasado 5 de abril

Política

Afirma AMLO que no ha sido liberado “Don Rodo”, hermano de “El Mencho” Oseguera

Un juez ordenó liberar inmediatamente a Abraham Oseguera, el domingo pasado, y podría salir en libertad en las próximas horas

Finanzas

Ganancias de BBVA México caen 0.9% en primer trimestre

Eduardo Osuna, vicepresidente y director general de BBVA México, aclaró que por ahora el banco no prevé un deterioro en la cartera de crédito

Mundo

José Mujica anuncia que padece un tumor en el esófago: "la vida es hermosa y se gasta"

Debido a que el expresidente de Uruguay padece una enfermedad inmunológica, recurrir a tratamientos como quimioterapia o cirugías, no son una opción