¿En qué punto se encuentra la traducción automática neuronal?

La traducción automática neuronal (NMT, por sus siglas en inglés) es el nuevo enfoque de la traducción automática. La NMT trabaja con una arquitectura end-to-end que tiene como objetivo entrenar todos los componentes simultáneamente para maximizar su rendimiento. La arquitectura tiene en cuenta la frase completa como contexto, lo que le permite lograr una traducción fluida.

¿Ha logrado la traducción neuronal automática equipararse a la traducción humana?

Recientemente, Google, Microsoft y SDL han sostenido que la traducción automática neuronal (NMT) ha logrado equipararse a la traducción humana en “Google’s Neural Machine Translation System: Bridging the gap between human and machine translation“, “Achieving human parity on automatic Chinese to English news translation” y “SDL cracks Russian-to-English translation”, respectivamente.

En un trabajo reciente perteneciente a la conferencia EMNLP 2018, se están llevando a cabo experimentos que comparan traducciones automáticas neuronales con traducciones humanas. La tarea consiste en clasificar 55 documentos y 120 frases del conjunto de pruebas chino-inglés WMT 2017. Los documentos y las frases se evalúan en condiciones monolingües (sólo texto en la lengua de destino) y bilingües (texto en la lengua de origen y en la lengua de destino). Los evaluadores son traductores profesionales con al menos tres años de experiencia y que cuentan con críticas positivas por parte de los clientes. Para la condición monolingüe, reclutaron 5 traductores nativos en inglés, mientras que para la condición bilingüe, reclutaron 2 traductores nativos en chino, 1 traductor nativo en inglés y 1 traductor nativo tanto en inglés como en chino.

En la condición monolingüe, los traductores preferían el texto producido por el hombre al texto producido por la máquina, tanto en lo que se refiere a las frases como a los documentos. En la condición bilingüe, las calificaciones de los traductores mostraron una preferencia significativa por la traducción humana sobre la traducción automática al evaluar los documentos. Sin embargo, no mostraron preferencia al evaluar frases aisladas, pues la traducción automática logra la paridad con el ser humano.

Este es, sin duda, un buen hallazgo. La calidad de la NMT es impresionante, pero hay dos aspectos importantes a considerar. El primero es que los autores son cautelosos al concluir que los resultados podrían hacernos pensar que la traducción automática (TA) se desempeña mejor en adecuación que en fluidez. Sin embargo, la evaluación de la TA puede ser probablemente más favorable cuando la mayoría de los traductores son nativos en el idioma de origen. El segundo es que la evaluación a nivel de oración puede ser insuficiente ya que se desconocen los contextos textuales, culturales y de otro tipo, y se deben tener en cuenta estos elementos para entender realmente la traducción.

Estos resultados confirman la necesidad de seguir investigando a nivel documental como en los trabajos recientes. Al aumentar el contexto a nivel de documento, la traducción automática podrá mejorar la coherencia y cohesión del texto traducido. La NMT a nivel de documento puede evitar algunos errores que a nivel de oración son imposibles de reconocer, como la concordancia de género a través de las oraciones.

Hoy en día, es más fácil leer un libro en cualquier  dispositivo

¿Es útil la traducción automática neuronal para traducir textos literarios?

El mercado de la traducción literaria está creciendo debido al uso de libros electrónicos. En los últimos años, las ventas de libros electrónicos se han duplicado en todo el mundo. Hoy en día, es más fácil leer un libro en cualquier dispositivo e incluso escuchar audiolibros. Obviamente, la traducción también está creciendo en este mercado. Sin embargo, la traducción de textos literarios requiere una creatividad que las máquinas no pueden permitirse ante, por ejemplo, la intraducibilidad, las metáforas o los modismos. Este es el escenario más desafiante para la traducción automática.

A pesar de la mejora del rendimiento de la traducción utilizando la traducción automática neuronal (NMT) debido a la consideración de la frase como contexto, los textos literarios siguen siendo difíciles de traducir automáticamente. Para saber hasta dónde podemos llegar con la traducción automática en el ámbito de la literatura, en este trabajo presentado por el Dr. Antonio Toral y el Prof. Andy Way, se traducen 12 novelas del inglés al catalán con sistemas de NMT:

Sunset Park de Auster (2010)

Los juegos de hambre 3 de Collins (2010)

El señor de las moscas de Golding (1954)

El viejo y el mar de Hemingway (1952)

Ripley Under Water de Highsmith (1991)

Mil soles espléndidos de Hosseini (2007)

Ulises de Joyce (1922)

En el camino de Kerouac (1957)

1984 de Orwell (1949)

Harry Potter 7 de Rowling (2007)

El guardián entre el centeno de Salinger (1951)

El Señor de los Anillos 3 de Tolkien (1955)

Se eligieron el inglés y el catalán (de diferentes familias) para hacer más difícil la tarea. Además, el catalán es una lengua europea de tamaño medio, lo que significa que hay recursos disponibles para formar un sistema, pero no tantos como en otras lenguas europeas importantes como el castellano, el francés, el alemán o el italiano. El sistema de NMT estaba formado por 133 novelas traducidas del inglés al catalán y 1000 libros escritos en catalán.

Los hablantes nativos de catalán clasificaron manualmente las traducciones de 3 libros, comparando la traducción humana con la NMT. Para 2 libros, el sistema de NMT obtuvo una calidad equivalente a la de las traducciones humanas en alrededor de un tercio de los casos.

Como ya se mencionó en un post anterior, la tecnología ha mejorado el rendimiento de la traducción automática en este campo, pero sigue siendo una tasa baja, por lo que requiere muchos esfuerzos de revisión humana. Los autores pretenden investigar si la NMT puede ser útil para ayudar a los traductores humanos en la traducción de textos literarios, ponderando el esfuerzo y la calidad.

Los nuevos enfoques y la recopilación de datos mejorarán estos resultados. Se está investigando mucho para lograr una tasa competitiva en el campo de la literatura. Algún día, la traducción automática estará lista para ello, pero llevará algún tiempo.

Este artículo fue guardado en redes neuronales,traducción automática el por .

Sobre mgarcia

PhD in computer science specialized in Neural Machine Translation. I graduated from Le Mans University at LIUM. Master in Artificial Intelligence and Computer Science Engineering from Polytechnic University of Valencia. Experience working with machine translation projects since 2010 at the Technological Institute of Informatics in Valencia, Polytechnic University of Valencia research groups and Copenhagen Business School. I recently joined Pangeanic.



Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *