Fa dies que tenia ganes d’escriure la meva opinió personal sobre l’ús actual i l’ús potencial de la traducció automàtica en el nostre ofici. Tot i que no abordaré el tema de la mateixa manera, un dels detonants que m’ha fet decidir a escriure aquesta entrada ha estat l’interessant debat generat arrel d’una entrada de @jodribal en el seu blog Méteteme. El debat és intens i hi ha opinions per tots els gustos, però sí que veig una dualitat curiosa: l’opinió dels traductors i la dels lingüistes. I jo, no em puc dividir i no sé ben bé on posicionar-me. Per això intentaré ser el més objectiu possible en aquesta entrada, veurem si ho aconsegueixo.
L’ús actual de la TA

No patiu. Ara per ara la TA està molt lluny de poder substituir la figura del traductor de forma completa. És cert que en alguns àmbits ha aparegut la figura del posteditor, que com explica a El arte de traducir @evamariamrtz es tracta de la persona que s’encarrega de revisar les traduccions automàtiques. Actualment, però, la qualitat de la TA és molt qüestionada, la qual cosa implica que cal una millora molt important per tal que aquesta estratègia de TA+posteditor sigui econòmicament viable, ja que en molts casos el posteditor ha de refer la traducció completament. Sembla que l’ús de la TA pot ser adequat en àmbits tècnics, sempre que es disposi de les eines i els glossaris adequats.
Tots tenim en ment la pobresa dels resultats de plataformes com Google Translate, però és important tenir en compte que aquestes eines no són especialitzades i la major part de la seva arquitectura està basada en l’estadística i deixa de banda les regles lingüístiques. En definitiva, crec que ara per ara Google Translate és útil per sortir del pas. És a dir, cal veure’l com a una eina per què el públic general pugui accedir a la informació que trobi a la xarxa. Crec que és un greu error plantejar-se utilitzar aquestes plataformes per a finalitats professionals.

Això vol dir que la TA no s’utilitza professionalment? No, al contrari, però hi ha diferents formes d’utilitzar-la. Tornant a l’entrada de @jodribal, hi ha qui utilitza Google Translate de forma professional, que com hem argumentat i com també es tracta al blog del Jordi és un error i pot ser contraproduent per al professional en qüestió. Però, què passa amb aquelles empreses que desenvolupen les seves pròpies plataformes de TA amb una finalitat concreta? En aquests casos, els resultats milloren ostensiblement sense arribar mai a poder prescindir de la figura del corrector o posteditor. Un exemple clar són diaris com El Periódico o La Vanguardia, que s’editen tant en català com en castellà i que utilitzen plataformes de TA dissenyades expressament per a aquestes empreses. De totes maneres, això no evita grans errades si no es realitza un procés de correcció adequat. Una de les errades més sonades va aparèixer a La Vanguardia en català on una “reflexión de Leo (Messi)” es va convertir en una “reflexió de Llegeixo”.
El futur de la TA
Per tal de poder parlar sobre el futur de la TA és important que la recerca en aquest àmbit determini quina és l’aproximació que pot donar millors resultats. Per exemple, cal una aproximació únicament estadística i entrenar els sistemes a través d’aprenentatge automàtic amb l’ajuda de corpus paral·lels de milers de milions de paraules o cal una aproximació híbrida on també hi tinguin cabuda certs models lingüístics que ajudin a millorar el resultat del sistema?
Microsoft és una de les grans multinacionals que també està desenvolupant un sistema de TA (desconec si és millor que la plataforma de Google) i fins ara ha basat la seva recerca en models estadístics, però a la seva pàgina també apunten la necessitat de tenir en compte models lingüístics per tal de millorar els resultats. Concretament, l’esquema del sistema que desenvolupa l’equip de recerca de Microsoft és el següent:
Permetrà aquesta aproximació millorar les traduccions automàtiques? És possible, però caldrà esperar per saber-ho. De fet, és possible que la TA acabi tenint un paper molt important en la nostra professió, però no cal alarmar-se. En certa forma, és similar al canvi que es va produir en la traducció quan van aparèixer les primeres eines de traducció assistida per ordinador. En un origen les TAO es van veure com una intrussió i ara, en molts àmbits, molts traductors no podrien concebre la seva feina sense el Trados o Wordfast.
Per tant, és important tenir en compte en quin estat es troben ara mateix els sistemes de TA i per a què s’han concebut. Però, sobretot, crec que no té sentit posar-se les mans el cap ara mateix ja que la TA encara ha de recòrrer un llarg camí abans de poder substituir un traductor humà, sobretot en àmbits que no siguin tècnics ni sistemàtics.
Segur que em deixo molts aspectes a tenir en compte, però m’estic allargant molt. De totes formes, el debat sempre és interessant i enriquidor sigui en el sentit que sigui. Per tant, seria genial si exposéssiu la vostra opinió al respecte o aportéssiu qualsevol aspecte que hagi passat per alt!

Perdón por escribir en castellano; el catalán lo puedo leer, pero redactar es otra cosa y no quiero pasar el texto por Google, vaya a ser que salga otra cosa que lo que quiero decir
.
Me ha gustado la entrada. Quería hacer un par de puntualizaciones: 1) la calidad de Google es mayor de lo que la gente se cree (y la prueba es que muchas herramientas de TAO permitían bajarte borradores de traducción para segmentos nuevos de Google); 2) La TA no pretende sustituir al traductor, sino ser una herramienta más como lo son las de TAO, y por eso conviene familiarizarse con ella, para ver qué oportunidades y qué peligros presenta.
¡Hola Joan! A mí me pasa como a Rubén: el catalán lo entiendo y lo puedo leer, pero a redactarlo no llego, así que, con tu permiso, escribiré en español : ).
En primer lugar, muchísimas gracias por mencionar mi entrada, me ha hecho mucha ilusión
.
En segundo lugar: yo hasta ahora he participado en 4 proyectos de posedición, con varias impresiones. En 2 de ellos tuve que modificar cosillas, pero me sorprendió la calidad general que se podía conseguir sobre el volumen total que me habían mandado, ya que las estructuras eran muy repetitivas y estaban muy marcadas. Pero con el último, la experiencia ha sido bastante negativa: era todo texto corrido (un manual), y básicamente me ha tocado traducir (que no poseditar) el 95% de lo que me han mandado, porque los textos no había por dónde cogerlos y tenía claro que lo hacía más rápida y borraba y traducía. Mi conclusión es que para cosas cortas y de estructura “mecánica” puede salir bastante rentable, pero para textos con un contenido más elaborado, el resultado es para suicidarse.
En respuesta a Rubén: los resultados de Google dependen del par de idiomas que uses. No te recomiendo que intentes traducir nada hacia o del árabe, por ejemplo xD.
Ei, gràcies per mencionar la meva entrada, Joan. No coneixia el teu blog, me l’apunto.
Pel que fa al motor de MS, tinc entès que és prou millor per al par EN>DE que no pas el de Google. I sí, MS és híbrid, mentre que Google és “només” estadístic. Poso “només” entre cometes perquè en realitat funciona molt millor amb més pars, m’imagino per l’immens volum de texts de Google.
PD: Jo sí parlo català, però no és la meva primera llengua. Espero no haver fotut massa espanyolades
Hola Jordi, moltes gràcies pel teu comentari i no et preocupis per escriure en català o castellà, no m’interessa la política.
Estic d’acord que Google és millor en algunes combinacions ja que s’han utilitzat corpus d’entrenament enormes, però igualment hi ha casos que calen models lingüístics per resoldre certes ambigüitats. Pel que fa a aproximació crec que la de MS és millor, però ara mateix els resultats d’un i altre són difícils de comparar. Suposo que serà un procés lent i caldrà veure com s’ho fan els equips de recerca i, sobretot, veure on és el límit.
Muchas gracias por vuestros comentarios. No creo que tengáis que justificaros por no escribir en catalán, leyéndolo hacéis mucho más que mucha gente. Soy yo quien debe daros las gracias por el esfuerzo.
@Rubén Interesante reflexión, estoy de acuerdo que en según que pares de idiomas los resultados no son tan malos, pero también depende del tipo de texto. Sin embargo, puede ser una buena herramienta si se utiliza adecuadamente. Ahora mismo la traducción automática no podría sustituir la tarea de los traductores, pero en el futuro y en según qué ámbitos no me atrevería a descartarlo. Desde mi punto de vista, es muy complejo que un sistema de TA traduzca un soneto, pero no veo tan imposible que pueda traducir formularios o instrucciones, por ejemplo.
@Eva No tengo tu experiencia en la posedición pero tu entrada me resultó muy interesante. Desconozco si poseditaste proyectos traducidos por el mismo sistema, pero tengo la impresión que si una empresa quiere apostar por esta tecnología debería preocuparse para tener un sistema de TA que se adapte a sus necesidades concretas para evitar que el poseditor haga una segunda traducción. Es decir, si quiero traducir manuales técnicos no tiene ningún sentido que entrene mi sistema de TA con un corpus de periódicos, por ejemplo. Estoy de acuerdo, que por ahora solo debería utilizarse por textos simples, pero es un reto muy interesante para la disciplina del procesamiento del lenguaje natural. Veremos hasta donde son capaces de llegar.
@Eva, curiosamente, el par árabe-inglés da bastantes buenos resultados en TA, en contra de lo que pueda parecer, porque se ha invertido mucho en investigación con fines militares (y más después del 11-S). La calidad depende del par, del tipo de motor que utilices y del tipo de texto original. Si metes un texto de la ONU en árabe para traducir al inglés en Google seguramente el resultado sea más o menos aprovechable (lo suficiente para que te cueste menos poseditar que traducir de cero), porque el motor de Google está entrenado en parte con el corpus multilingüe de la ONU (me suena que Jordi comentaba algo parecido sobre textos de la UE en su entrada TA). Aparte, creo que se está hibridando también, porque al componente estadístico están añadiendo anotación sintáctica (PoS; Part-of-Speech).
@Joan, la TA ya sustituye a los traductores en algunos casos, como la Knowledge base de Microsoft o los partes meteorológicos de METEOR en Canadá hasta hace poco (creo que han cambiado de motor). Con fines informativos, puede funcionar; para traducciones con un mínimo de calidad, no. Y me lo comentó hace poco alguien que lleva más de diez años trabajando en TA: siempre va a hacer falta posedición, por bueno que sea el sistema.
Yo creo que la clave es familiarizarse lo suficiente con la tecnología para argumentarle a un cliente cuándo es aceptable la posedición y cuándo no. Está feo citarse a uno mismo, pero os dejo aquí una presentación que hice sobre TA hace poco porque creo que os puede resultar de interés:
http://www.box.com/shared/itd488sne38bgl18taeo
Y si tenéis cualquier duda o comentario, será muy bienvenido.
@Rubén, gracias por compartir tu presentación. Lo que dices del par árabe-inglés tiene mucho sentido (y lo digo así porque no he probado a hacer traducciones entre estas dos lenguas), pero el árabe-español es desastroso >_<.
@Joan Los 4 proyectos pertenecían a lo mismo, pero no sé si serán resultado del mismo sistema. Yo imagino que sí porque es lo que me dicta la lógica, pero me temo que en texto corrido el resultado deja que desear.
Muchas gracias por compartir tu presentación. ¡Seguro que nos será de gran utilidad a todos!