MT Hub es la nueva plataforma inteligente de traducción automática

El consorcio paneuropeo iADAATPA ha construido nueva plataforma inteligente de traducción automática que de forma dinámica puede cambiar sin problemas entre motores específicos de traducción automática neuronal para producir traducciones prácticamente humanas.

El consorcio iADAATPA se convirtió en MT-Hub, una infraestructura de código abierto para que las Administraciones Públicas gestionen y enruten las solicitudes de traducción automática.

Manuel Herranz presentando iADAATPA en la sede de la Comisión Europea Madrid

La rapidez de las comunicaciones transfronterizas es siempre un reto para la industria, los servicios y las administraciones públicas, y más aún dentro de la Unión Europea, una entidad política con 24 lenguas oficiales y una miríada de lenguas cooficiales y minoritarias, desde el catalán-valenciano, el gallego y el vasco en España hasta el sami en Finlandia, el occitano en Francia o el ruzyn en la República Checa, Hungría y Eslovaquia. La mayoría de los Estados miembros de la UE cuentan con sistemas de traducción automática en algunos niveles de la administración pública, aunque muchos de ellos siguen basándose en normas o no ofrecen las funciones industriales y la calidad más recientes.  Muchos Puntos Nacionales de Anclaje (NAPs) y autoridades nacionales consideran que ya es hora de reemplazar los sistemas antiguos por tecnología del siglo XXI, en particular los nuevos neural machine translation.

Ya en 2017, nuestra empresa matriz Pangeanic tuvo la novedosa idea de formar un consorcio europeo para construir una plataforma escalable y segura, alineada con los objetivos de la “Facilidad Conectando Europa” de la Comisión Europea para la provisión de un único punto de conexión con los servicios de traducción automática de varias empresas. En realidad, esto significaba construir una infraestructura nacional de código abierto desplegable que permitiera a las administraciones públicas ejecutar cualquier sistema de máquinas de una o varias empresas sin tener que depender de la solución de la empresa. La idea se denominó iADAATPA (Intelligent, Automatic Domain Adapted Automated Translation for Public Administrations) y funcionaría como un enrutador de motores de traducción automática con mecanismos inteligentes de detección de idiomas y dominios. La idea era proporcionar una infraestructura nacional que apoyase y funcionase, de una forma similar a la eTraducción, detectando el idioma y el dominio de un documento dado y dirigiéndolo al motor de traducción más adecuado para traducir el contenido. El consorcio fue más allá, mejorando la granularidad de la selección a nivel de página o incluso de párrafo.

En resumen, uno de los principales atractivos de iADAATPA como plataforma inteligente de traducción automática es cambiar entre los motores de traducción automática dentro de un documento.  Diferentes partes de un documento, pueden ser traducidas por diferentes motores, tan pronto como se detecte un cambio de idioma o dominio. De este modo, las administraciones públicas pueden ofrecer contratos marco a una o varias empresas tecnológicas para la traducción automática dentro de sus fronteras nacionales con una infraestructura ya creada que ha sido financiada por el programa “Connecting Europe Facility”.

Socios en el proyecto

El proyecto comenzó en septiembre de 2017 y duró un año y medio. El consorcio iADAATPA estaba formado por Pangeanic (España), SEAD – el Secretario de Estado para el Avance Digital (España), Everis (España), Prompsit (España), Segittur (España), Tilde (Letonia), KantanMT (Irlanda) y la Dublin City University (Irlanda).

iADAATPA se integró en el servicio de traducción automática eTranslation de la CE para que las administraciones públicas puedan obtener traducción automática del dominio político y jurídico gratuitamente. El estándar eDelivery (AS4 Domibus) se utilizó para garantizar el intercambio seguro y fiable de los documentos a traducir. Esta función es ahora parte de la plataforma para garantizar el cifrado y la seguridad en todas las transmisiones de datos. Para complementar aún más las capacidades de eTranslation, los miembros del consorcio también realizaron integraciones adicionales a sus propios motores de traducción automática para cubrir los dominios (áreas de conocimiento) que no soporta eTranslation.

iADAATPA utiliza sofisticados algoritmos aplicados a redes neuronales basados en inteligencia artificial, en lugar de los métodos estadísticos tradicionales basados en patrones de secuencia de palabras, por ejemplo. Los socios del consorcio y la Comisión Europea acordaron adoptar ese enfoque basado en redes neuronales al principio del proyecto. La plataforma fue implementada y probada en los siguientes casos de uso:

  • Generalitat Valenciana, España – El portal de Open Data del departamento de transparencia de la Generalitat Valenciana
  • SEGITTUR España – Servicios digitales prestados por la agencia de innovación y tecnología turística con sede en Madrid.
  • Parlamento lituano – Traducción de los procedimientos parlamentarios en el Parlamento lituano
  • Deutsche Welle

Resultados y beneficios

Las capacidades de detección de idiomas y dominios de iADAATPA, como plataforma inteligente de traducción automática, son muy atractivas para lograr una mejor experiencia de traducción automática. Ofrecer una plataforma neutra desde el punto de vista tecnológico y de las empresas incrementará la eficiencia y la competencia entre las empresas de traducción automática y conducirá a un mayor uso de la tecnología por parte de las administraciones públicas, a un ahorro de costes. Asimismo, contribuirá a una mayor disponibilidad de contenidos multilingües, a una mejor y más rápida comunicación entre las administraciones públicas europeas y a unos precios de traducción más competitivos. Al mejorar el acceso a los diferentes proveedores de traducción automática, también contribuirá a la realización del mercado único digital en Europa.

La plataforma ha demostrado estar lista para ser utilizada por las administraciones públicas, y el Consorcio está trabajando estrechamente con las autoridades españolas para desplegarla como infraestructura nacional en España.  Basándose en el resultado positivo del proyecto, las autoridades españolas han decidido adoptar iADAATPA, ahora llamada plataforma MT-hub, como componente central de su infraestructura nacional de traducción.

Los resultados de la plataforma inteligente de traducción automática iADAATPA también superaron las expectativas del Parlamento lituano. No hace mucho tiempo, Lituania sufrió malas experiencias con tecnologías de traducción automática estadística pues su idioma es altamente inflectivo (tiene muchas declinaciones) y morfológicamente rico y por lo tanto difícil de traducir con los métodos tradicionales de traducción estadística, los cuales se basaban en una mezcla de casuística de ejemplos y memoria. Con iADAATPA, la productividad y la calidad de la traducción automática aumentaron significativamente. El socio letón del consorcio Tilde, responsable de la implementación en el Parlamento lituano, informó de aumentos de productividad cercanos al 40 % en la producción de traducciones de calidad humana.

Todos los miembros del consorcio tenían capacidades tecnológicas y conocimientos complementarios, lo cual hizo que la colaboración fuese muy fructífera. El profesor Andy Way, de la Universidad de Dublín, se alegró de que “los socios del consorcio iADAATPA hayan demostrado un nivel tan alto de profesionalidad y me encantaría volver a trabajar con todos ellos. Esta es la prueba de un consorcio bien dirigido”.

Siguientes pasos

El consorcio se centra ahora en una segunda parte del proyecto con el objetivo de hacer realidad la “plataforma inteligente de traducción automática” en todas las administraciones púbicas europeas en las que resulte posible, alentando la adopción de la herramienta como un nuevo servicio a la ciudadanía.

Este servicio ayudará a las administraciones públicas a aplicar una política de no dependencia frente a las empresas de traducción automática y gestionar sus propias redes de traducción automática, con la posibilidad de habilitar sus propios “centros de traducción automática” a diferentes niveles.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *