Posiblemente el tema por excelencia que nos interesa a todos los que nos dedicamos a la Tradumática sea la Traducción Automática, por la que entendemos la traducción totalmente mecánica, hecha con máquinas sin ayuda de humanos (en principio).

Aunque en el pasado se utilizaban métodos rudimentarios, como la traducción palabra por palabra o la basada en simples reglas de transferencia, cada vez estos sistemas se han vuelto más sofisticados y ahora utilizan métodos estadísticos para extraer modelos de traducción (comparando corpus paralelos extraen patrones de traducciones que luego utilizan cada vez que aparece una expresión igual o muy similar en el nuevo texto fuente), basados en ejemplos, redes neuronales etc. que cada vez logran mejores resultados, aunque está claro que todavía no hemos llegado al grado de tener traducciones perfectas hechas únicamente por la máquina (y parece ser que todavía tardaremos bastante…).

La traducción automática siempre ha tenido mala fama, especialmente entre los traductores, que la han considerado una pérdida de tiempo. Si bien es cierto que no es la mejor solución para traducir literatura o marketing, sí puede ser una buena opción para determinados tipos de sublenguajes. Asimismo, puede resultarnos muy útil para lo que los americanos llaman “gisting”, es decir entender de qué va una página que está en un idioma que no conocemos de nada.

Os dejo aquí un vídeo del traductor de Google, basado en métodos estadísticos, y que cada vez está logrando mejores resultados (claro, con el gran corpus con el que cuentan… :-):

Sep
24
Filed Under (Déjà Vu, Páginas web) by Laura on 24-09-2008

La traducción de páginas web es sin duda un tema algo complejo, no porque sea difícil en sí, sino por la gran cantidad de cuestiones que hay que tener en cuenta.

Para empezar, intentar traducir una página web sin tener un programa específico que extraiga el texto entre etiquetas, puede convertirse en una auténtica locura: habría que meterse en el código HTML, detectar los segmentos que han de traducirse y ponerse a escribir. Esto por un lado puede llegar a ser muy pesado, ya que los editores simples no ofrecen las mejores funciones de visualización. Por otro lado, además, corremos el riesgo de borrar etiquetas o modificar argumentos o parámetros que pueden cambiar el resultado final.

Traducir una página web con una herramienta TAO o de localización no sólo nos facilita el trabajo al extraer el texto traducible, sino que nos permite guardar nuestra traducción en una memoria, gestionar terminología, gestionar clientes, contar las palabras exactas (las del texto que se ha de traducir y no las etiquetas) para presupuestos y facturas etc.

En fin, iré comentando poco a poco algunos aspectos específicos de la traducción de páginas web. Por ahora os dejo con este vídeo creado por la UEM que me ha parecido interesante de cómo traducir una página web con Déjà Vu X (DVX), de la empresa Atril.

Sep
24
Filed Under (Estándares, TMX) by Laura on 24-09-2008

TMX es un estándar abierto basado en el metalenguaje XML y desarrollado y mantenido por OSCAR, (Open Standards for Container/Content Allowing Re-use), un grupo de LISA dedicado a la creación de estándares. TMX ha sido creado para facilitar el intercambio de datos de memorias de traducción creados por herramientas TAO y de localización sin que haya pérdidas de datos significativos. Se creó en 1998 y desde entonces podemos decir que en la actualidad la mayoría de herramientas del mercado admiten la importación y exportación de memorias en TMX.

Por ejemplo: imaginemos que un compañero crea una memoria con el programa SDL TRADOS y que nosotros tenemos Déjà Vu. En principio cada programa crea la memoria en un formato propietario y, por tanto, incompatible.

Translation Memory Exchange

Sin embargo, es posible intercambiar esos datos si el compañero EXPORTA su memoria a TMX y yo, desde Déjà Vu, la IMPORTO. La memoria en TMX contiene los datos marcados con una serie de etiquetas que indican qué tipo de dato es el que tenemos entre las manos. Veamos un ejemplo extraído del artículo de Joseba Abaitúa “Memorias de Traducción en TMX compartidas por Internet“:

<TU>

<TUV lang=”EN” creationdate=”1600″ creationid=”William Shakespeare” changedate=”1951″ changeid=”Peter Alexander/Collins”> <SEG>Exeunt marching. A peal of ordance shot off.</SEG></TUV>

<TUV lang=”ES” creationdate=”1929″ creationid=”Luis Astrana Marín/Aguilar” > <SEG>Marcha fúnebre. Salen, llevándose los cadáveres. Después se oye una descarga de artillería.</SEG></TUV>

<TUV lang=”ES” creationdate=”1994″ creationid=”José María Valverde/Planeta”>
<SEG>Se van marchando; después, se disparan salvas de artillería.</SEG></TUV>
</TU>

En primer lugar vemos que se abre una Unidad de Traducción (Translation Unit o TU) con la etiqueta <TU> y que se cierra al final con </TU>. Aquí se encontrarán la frase original y el conjunto de sus traducciones a uno o varios idiomas. A su vez, con la etiqueta <TUV> , que significa “Translation Unit Variant” o Variantes de la Unidad de Traducción, se incluyen tanto el segmento original como cada una de las traducciones (cada una dentro de un elemento <TUV>. Este elemento tiene una serie de atributos como son el idioma (lang), la fecha de creación (creationdate) y el creador de esa unidad de traducción (creationid), de forma que la traducción pueda ser identificada unívocamente. Finalmente aparece el segmento en sí entre las etiquetas <SEG> </SEG>.

Aunque como traductores es raro que utilicemos el formato TMX de forma activa (es decir, para programar o modificar archivos), sí que es conveniente tener algunas nociones para poder interpretar este tipo de formato.

Si queréis profundizar, además de los hipervínculos que aparecen en el texto, un enlace interesante es la especificación de TMX y, en español, la Guía al TMX.

Sep
24
Filed Under (Edición, MS Word) by Laura on 24-09-2008

– Oye, ¡que me has mandado un documento en formato docx y no puedo abrirlo!
– Pues no lo entiendo…
– ¿Con qué versión lo has creado?
– Con Word 2007…
– Ahhh, es que yo tengo 2003. Pues tendrás que Guardar como… 2003.
– Ok

Seguro que esta conversación o parecida la habrá tenido más de uno de los que leéis este blog… Bueno, pues por si no lo sabéis, los que tengáis la versión 2003 de Word sí podéis leer los documentos creados directamente en Word 2007. Para ello sólo tenéis que instalaros este paquete de compatibilidad de Microsoft. Este paquete de compatibilidad incluye no sólo Word, sino también Excel, Power Point. Lo podéis descargar en este enlace.

Os ahorraréis así una gran cantidad de tiempo y dinero al no tener que convertir archivos, enviarlos aquí y allá o llamar para resolver dudas.

No obstante, cabe tener en cuenta las limitaciones de compatibilidad a las que Microsoft hace referencia en la página antes enlazada.

Aquí tenéis un vídeo en inglés que os lo explica, pasito a pasito: