Aplicaciones de traducción, reconocimiento y síntesis de voz ya son muy buenos en idiomas hablados por millones de personas, tales como Inglés, francés, alemán o portugués.
Pero todavía son de poco valor para los hablantes de lenguas menos difundidas precisamente porque falta "masa de datos" para que los sistemas de inteligencia artificial en los cuales se basan estas herramientas obtengan la formación necesaria.
"Cuando desarrollamos sistemas de traducción automática y motores de búsqueda, por lo general se inserta en la computadora gran cantidad de textos anotados manualmente que contienen información sobre la función y el significado de las palabras individuales.
"Por razones históricas, estos textos han sido principalmente los artículos de prensa en Inglés y otros idiomas importantes. Nosotros no tenemos acceso a los textos escritos en lenguas menores como la feroesa [Islas Feroe], el galés, el gallego y el irlandés, o incluso una lengua africana grande como el yoruba, que es hablado por 28 millones de personas ", explica el profesor Anders Sogaard de la Universidad de Copenhague, Dinamarca.
La sabiduría bíblica
Pero los artículos periodísticos no son la única fuente posible de información sobre las palabras y frases en un idioma determinado. Hay un gran libro, el más traducido en el mundo y probablemente también el que más se comenta: la Biblia.
"La Biblia ha sido traducida a más de 1.500 idiomas, incluso en idiomas menores y más" exóticos", y las traducciones son extremadamente conservadoras: los versículos tienen una estructura completamente uniforme en muchos idiomas diferentes, lo que significa que nosotros podemos construir modelos de computador adecuados incluso de las lenguas menores, de las cuales nosotros tenemos sólo unos cientos de páginas de las Escrituras ", dijo Sogaard.
Ahora, el equipo presentó los primeros resultados de su "esfuerzo bíblico."
"El esfuerzo está dando sus frutos, pues ya ha servido para construir los modelos de más de 100 idiomas" exóticos ", como el swahili, wolof y xhosa, que se hablan en Nigeria [y otros países africanos]. Esto significa que podemos desarrollar tecnologías de lenguaje para esos idiomas similares a las disponibles para los hablantes de Inglés o francés ", dijo el investigador.
El trabajo del equipo no tiene fecha de finalización, y el esfuerzo para crear nuevas herramientas - el tipo de aplicaciones como Siri y Google Translate - poara idomas menos hablados continuará.
Innovación Tecnológica
Comentarios
Publicar un comentario
Querido alumno, deja tu comentario o respuesta aquí.