Blog sobre Tecnologías de la Traducción
¡Hola a todos!
Sé que hace tiempo que no me dejo ver por aquí, pero me encuentro en la recta final de mi tesis doctoral y no tengo el espacio temporal ni mental para poder escribir algo en condiciones. Mientras termino esa fase de mi vida, aquí os dejo información que os puede interesar: se trata de dos cursos que se celebrarán próximamente en Valencia y Alicante relacionados con la traducción y las tecnologías. Al primero podré asistir, pero el de Alicante me viene algo peor, así que si vais, ya me contaréis qué tal (aunque seguro que, impartiéndolo Chelo Vargas, está fenomenal):
- Curso de localización de videojuegos en Valencia, impartido por Pablo Muñoz Sánchez, traductor experto en videojuegos y autor del blog Algo más que traducir. Fecha: sábado 4 de junio. Lugar: Interpunct, Quart de Poblet. Duración: 8 horas. Plazas: 15 Precio: 120 euros.
- Curso de traducción asistida por ordenador: SDL Trados Studio 2009, Nivel Intermedio (Certificación Oficial, Nivel 2), impartido por Chelo Vargas, profesora titular de la Universidad de Alicante y experta en traducción asistida. Fecha: 27-30 de junio. Lugar: Universidad de Alicante, GB/INF1 y GB/INF2 del edificio Germán Bernácer. Duración: 30 horas. Plazas: 68 Precio: Estudiantes y miembros UA: 100€; Estudiantes, miembros de otras universidades, miembros de la Xarxa de traductores e intérpretes de la Comunidad Valenciana y desempleados: 130€; Profesionales en activo: 180€
Como veis, tenemos mucha suerte de contar con formación y profesionales de tan alto nivel por nuestras tierras, así que aprovechad la oportunidad y seguro que no os arrepentís ;)
SDL acaba de sacar al mercado su última versión, SDL Trados Studio 2009, en la que se integran todas las aplicaciones que anteriormente incluían las suites SDL Trados 2006 y 2007 (Workbench, WinAlign, SDLX etc) en una sola interfaz, a semejanza de programas como Déjà Vu. Desaparece TagEditor y la posibilidad de trabajar directamente en el editor de textos de Microsoft. Sin duda un gran cambio con respecto a lo que ha sido la política comercial y de producto de Trados y más recientemente de SDL Trados, quizá algo atrevido teniendo en cuenta que muchos traductores todavía trabajan en entorno MS Word y que están acostumbrados a utilizar las macros de Trados… la nueva interfaz supondrá dedicarle algunas horas a “reaprender” los nuevos iconos y atajos de teclado.
La nueva interfaz muestra el texto en forma de columna, como lo hacía ya SDLX o Déjà Vu. Las coincidencias terminológicas y los elementos sustituibles (placeables) se marcarán como en Workbench (subrayado rojo o azul). Asimismo, las palabras que estén escritas por entero en mayúsculas, podrán considerarse como elementos sustituibles, ya que normalmente se trata de siglas o acrónimos.
Existe también la posibilidad de previsualización de los documentos en todo momento, lo que permite ver los cambios en el documento real.
Los documentos se importarán al programa y se transformarán al formato xliff, lo que favorecerá el intercambio con otras herramientas TAO. No obstante, podrán seguir abriéndose los documentos en ttx (el antiguo formato propietario de SDL Trados), pero no al revés (es decir, lo que se cree en la nueva versión no podrá ser abierto en versiones anteriores… ¿a qué me suena esto, MS Word 2007??). Para ello será necesario convertir las memorias a tmx, formato que ya se utilizaba en versiones anteriores.
Se incorpora también el estándar TBX para el intercambio de datos terminológicos.
Se trabajará además en proyectos, de forma que dentro de un mismo proyecto con una misma terminología y una misma memoria, podremos tener documentos de varios tipos.
Se podrán agregar a un proyecto más de una memoria y más de una base de datos terminológica.
Posibilidad de traducir documentos PDF, lo que sin duda supone una ventaja competitiva con respecto a otras aplicaciones.
Otras novedades son la corrección de errores en tiempo real (lo que puede llegar a ser un verdadero dolor de cabeza, aunque esto es más bien cuestión de gustos), las coincidencias de subsegmentos, AutoSuggest y PerfectMatch. La primera función consiste en la sugerencia automática de terminología mientras se traduce (algo parecido al Autotexto de Word), recurriendo a la terminología y a memoria para encontrar los términos apropiados. La segunda asegura las coincidencias 100% comprobando además el contexto (que los segmentos anteriores y posteriores sean idénticos también).
SDL Trados Studio 2009 está disponible en edición freelance y professional, con un precio de oferta de 715 euros (740 la versión plus, con opción a instalarlo en dos ordenadores) y de aproximadamente 2000 euros (no he podido encontrar el precio exacto) respectivamente.
Os dejo aquí una captura para que veais el aspecto del nuevo producto:

Si queréis saber más del producto, podéis bajar la descripción del producto desde este enlace y asistir a alguno de los seminarios en línea que organiza la propia empresa.
Para terminar, aquí tenéis algunos artículos de otros blogs y otras páginas web en los que se ha comentado la noticia:
http://localizationlocalisation.wordpress.com/2009/04/22/sdl-trados-studio-2009-preview/ (en inglés)
http://blog.albatrossolutions.com/tent-cat-tools/new-features-of-sdl-trados-studio-2009 (en inglés)
http://bulgarian-translator.com/new-features-sdl-trados-studio-2009/ (en inglés)
http://www.tracom.de/GER/rss2html.php (en alemán)
http://simmer-lossner.blogspot.com/2009/04/sdl-trados-studio-2009-bohica.html (en inglés)
http://www.tekom.de/upload/2749/2009_Lintunen.pdf (en inglés)
No sé si recordaréis que hace poco hablamos del lanzamiento de la nueva versión del GMT (gestor de memorias de traducción) Wordfast Pro. Pues bien, parece ser que ahora además van a lanzar una serie de seminarios online, gratuitos y de 20 minutos de duración. Vamos, que van a ser como pequeñas “píldoras de conocimiento”,
El programa, con los temas y horarios, es el siguiente, y podéis inscribiros en este enlace:
|
Webinar #1 – Installing, Activating, Licensing Wordfast Pro |
|
Webinar #2 – Setting up your preferences in Wordfast Pro |
|
Webinar #3 – Project, TM, and glossary setup and maintanence |
|
Webinar #4 –TXML files |
|
Webinar #5 – DOC, XLS, and PPT Files |
|
Webinar #6 –Translating HTML and XML files. |
|
Webinar #7 – Icons and Shortcuts |
|
Webinar #8 – Wordfast Add-ons |
Hoy hablaremos de otra herramienta de traducción asistida: OmegaT. Este software libre y además gratuito permite la gestión de memorias de traducción y de glosarios terminológicos, e incluye otra serie de utilidades que pueden descargarse como un alineador de textos o un convertidor de textos alineados en formato TMX para su importación en una memoria. El programa principal puede descargarse en este enlace.
Una de las ventajas de este programa es que, al igual que Wordfast, es multiplataforma, es decir, existen versiones para Windows, Linux y Mac, además de una versión para aquellos desarrolladores que quieran seguir mejorando el programa.
Hay una especie de “manual de usuario” muy útil en http://atraducir.info/omegat/ además de una lista de correo en la que se anuncian novedades y se resuelven dudas sobre esta aplicación.
OmegaT tiene las siguientes características:
* Coincidencias parciales
* Propagación de coincidencias
* Procesado simultáneo de proyectos con archivos múltiples
* Uso simultáneo de múltiples memorias de traducción
* Glosarios externos
* Formatos de archivos:
XHTML y HTML
Microsoft Office 2007 XML
OpenOffice.org/StarOffice
XLIFF (Okapi)
MediaWiki (Wikipedia)
Sólo texto
* Soporte Unicode (UTF-8): puede utilizarse con alfabetos no latinos
* Soporte para idiomas derecha-izquierda
* Compatible con otras aplicaciones de memoria de traducción (TMX)
Creo que entre todas estas características cabe destacar fundamentalmente dos: el hecho de que utilice TMX como formato de memoria, lo que permite la compatibilidad con otras herramientas TAO, y el que ahora pueda traducir archivos generados en Office 2007, lo que facilita la labor a aquéllos que disponen de este software propietario sin necesidad de convertir los archivos para ser leídos en OpenOffice.
Si bien este software no es tan sofisticado ni ofrece tantas funcionalidades como otras aplicaciones comerciales, puede ser una buena opción para introducirse en el mundo de las herramientas TAO sin necesidad de una gran inversión (al menos de dinero).
Os dejo aquí un tutorial en tres partes de cómo empezar a utilizar OmegaT. Espero que os sea de utilidad. ¿Alguien trabaja de forma regular con OmegaT? ¿Cuál es su experiencia?

El pasado día 1 de enero Wordfast lanzó una primera versión de Wordfast Professional 6.0. Al contrario que las versiones anteriores, que utilizaban el editor de MS Word para trabajar, la nueva aplicación está basada en Java y, por ello, es independiente y multiplataforma. Es decir, tanto los usuarios de Windows como los de Mac OS X y Linux podrán trabajar con ella (hay que añadir aquí que la última versión de Classic, 5.53q, parece ser que también funcionaba ya para Mac y Linux).
La última versión 6.0 puede descargarse desde el sitio de la empresa junto con una licencia de prueba cuya duración expira el 31 de enero de 2009. Así que si queréis probarla, ¡no tardéis mucho! La ayuda la tenéis en este enlace.
Vamos a repasar las ventajas de esta nueva aplicación:
Cabe destacar que la herramienta está todavía lejos de su madurez, como lo demuestran los asuntos por tratar que aparecen en la página web de la empresa. De hecho, la empresa piensa seguir manteniendo la versión Classic, que trabaja directamente en MS Word, y desarrollarla paralelamente con esta versión, hasta que esté plenamente madura o los usuarios empiecen a dejar de utilizar el editor de Word como herramienta de traducción.
En fin, veremos qué repercusión tiene esta versión. Sin duda, Wordfast cuenta con el beneplácito de la comunidad de traductores, sobre todo los autónomos, y esperamos que esta versión traiga mejoras reales que les ayuden a ser más efectivos en su trabajo (porque eficaces ya sé que lo son :) y que el señor Yves Champollion no nos decepcione…
La mayoría de herramientas de extracción de terminología son comerciales, como MultitermExtract o PhraseFinder de SDL. Sin embargo, de vez en cuando encontramos alguna herramienta gratuita como Lexterm, que permite extraer listados de términos a partir de textos, tanto monolingües, como bilingües. El corpus paralelo ha de ser un fichero de texto con un segmento original seguido de tabulador y del segmento traducido en cada línea. Así pues, si podemos exportar de la memoria de traducción o del archivo de alineación a formato txt en tabla, será suficiente.
La herramienta puede descargarse en este enlace, desde donde próximamente se anuncia la descarga de Libertra, un sistema de traducción asistida de código libre. Los autores hacen una presentación de la misma en este artículo.
La aplicación, que sólo tiene interfaz en catalán, se distribuye como un ejecutable para Windows que no necesita instalación. Así pues, sólo hemos de descargarnos el zip y descomprimirlo en el lugar donde queramos guardar la aplicación. Después bastará con crear un icono de acceso directo en el escritorio o en nuestro menú de Inicio.
Una vez abierto, podemos abrir textos monolingües o bilingües, siempre en formato txt (es decir, si tenemos archivos en otros formatos, habrá que convertirlos antes).
La herramienta permite también la aplicación de stop lists o listas de palabras vacías. Con el zip vienen tres, en inglés, catalán y español, y podéis encontrar otras en este enlace. La herramienta también nos permite limitar el número de n-gramas para la extracción, para que extraiga agrupaciones de 1, 2 y hasta 10 palabras.
Este sería un ejemplo de cómo deberíamos proceder para extraer candidatos de un corpus bilingüe:
Cuando se busca un equivalente de traducción siempre selecciona el más probable, pero es posible visualizar todos los posibles candidatos por orden de probabilidad. LexTerm también permite visualizar los contentos donde aparece el término original y traducido con el menú Cerca, seleccionando previamente el término. Esto puede ser de utilidad en caso de duda.
Una vez revisada la lista de candidatos y de equivalentes el resultado de la extracción se puede exportar a un formato de texto separado por tabuladores. Para exportar los términos, hemos de marcarlos en la lista. A partir de este formato se pueden introducir los términos en un sistema de gestión de terminología o importarlos en una base de datos terminológica de alguna herramienta de traducción asistida.
¡Espero que os sea de utilidad la herramienta…! Yo la he probado un par de veces y, aunque obviamente hay que revisar la lista, pensad en el trabajo que os ahorra si tuvierais que hacerlo de forma manual.
Los índices en Word nos pueden ayudar a crear una lista de palabra con las páginas en las que aparece. Esto es muy común en manuales y otro tipo de fuentes de referencia, que no se leen de forma lineal, sino que se consultan según el tema que nos interese. Así pues, el índice nos ayudará a localizar ese tema y averiguar en qué página se encuentra.
Como traductores, es importante conocer cómo se crean estos índices, ya que en ocasiones tendremos que traducirlos y, para ello, no habrá más remedio que crearlos de nuevo.
Para poder crear un índice, hemos de revisar el documento y encontrar las palabras clave que queremos que aparezcan en el mismo. Una forma sencilla de hacerlo, sin tener que leer todo el documento, puede ser hacer un análisis previo con una herramienta como AntConc, para ver qué palabras aparece con más frecuencia y son, por tanto, terminológicamente más significativas.
Hay dos maneras de hacer el índice, una manual y otra automática. Vamos a empezar con la forma manual:
Crear un índice de forma manual
Nos situamos en la primera palabra o expresión que queramos introducir en nuestro índice. La seleccionamos y después vamos al menú Insertar -> Referencia -> Índices y Tablas. En la ficha Índices pincharemos en la opción Marcar entrada (también se puede acceder directamente con el atajo Alt+Shift+X).

Aparece entonces un cuadro de diálogo en el que podemos ver en la casilla Entrada, el término que hemos seleccionado. Es posible también crear subentradas de la entrada principal. Éstas aparecerán debajo de la entrada principal y sangradas a la derecha y se utilizan cuando una entrada principal tiene términos estrechamente relecionados con ella que también aparecen en el documento. En Opciones podemos indicar si deseamos que se muestre en el índice una referencia cruzada o si queremos que se muestre la referencia a una pagina o intervalo de paginas. Asimismo, podemos hacer que el número de página tenga el formato de negrita y/o cursiva.

A continuación podemos elegir Marcar o Marcar todas, para marcar, respectivamente, sólo esa palabra o expresión o todas las que aparezcan en el documento. Veremos entonces que se ha introducido una marca de índice entre paréntesis. Si nos molestan, podemos ocultarlas con la opción Mostrar u ocultar marcas de párrafo, que normalmente aparece con un icono en forma de P invertida en nuestra barra de herramientas. A la hora de imprimir o trabajar con el documento las marcas no afectan en nada al texto ni a su maquetación.
Para seguir marcando el resto de entradas, no es necesario cerrar este cuadro de diálogo. Nos iremos moviendo por el documento y buscando las palabras que nos interesen, para después repetir los pasos que hemos comentado. Cuando terminemos de marcar todas las entradas, pulsaremos en Cancelar.
Crear un índice de forma automática
Vamos ahora a ver una forma diferente de crear el índice. Para ello necesitamos otro documento en el que crearemos una tabla de dos columnas. En la primera columna insertaremos una fila por cada término o expresión que queramos introducir en nuestro índice. Es importante que estén escritos de forma idéntica a como están escritos en el documento, si no no los reconocerá. En la segunda columna podremos el texto que queremos que aparezca en el índice final. En general, pues, coincidirán la primera y la segunda columna. Si queremos que haya subentradas, en la segunda columna podemos hacerlo poniendo dos puntos tras la entrada principal y después la subentrada.
Una vez finalizada la tabla, guardaremos y cerraremos el documento de forma normal. Después vamos de nuevo a Insertar -> Referencia -> Índices y Tablas y seleccionamos ahora la opción Automarcar. Aparece entonces un diálogo para seleccionar el fichero donde tenemos el listado. Seleccionamos el fichero que hemos creado y pulsamos Abrir. Se marcarán de forma automática todas las entradas de nuestra tabla.
Insertar el índice en nuestro documento
Por último, una vez tenemos todas las marcas ya definidas bien haya sido manual o automáticamente podemos crear el índice.
Nos situamos en el lugar del documento donde queramos introducirlo (normalmente al final).
Accedemos al menú Insertar – Referencia – Índice y tablas y aparecerá un cuadro de diálogo Índice y tablas como el que vemos en la imagen. Accedemos ahora de nuevo al menú Insertar – Referencia – Índice y tablas. A continuación sólo tenemos que configurar las opciones de apariencia del índice (p.e. si las subentradas han de aparecer de forma continua o con sangría, si los números se han de alinear a la derecha, las columnas en las que ha de aparecer el índice, el estilo etc.) y terminamos haciendo clic en Aceptar, lo que generará el índice.

Cómo traducir los índices índice en nuestro documento
Ahora vamos a ver qué opciones tenemos para traducir los índices. Tenemos básicamente dos opciones:
¿Alguna idea más? ¿Os habéis enfrentado alguna vez a este problema? ¿Cómo lo habéis resuelto?
Os voy a presentar una de las herramientas que utilizo en clase para que los alumnos aprendan cómo explotar sus propios recursos documentales.
Se trata de AntConc (versión 3.2.1), un software gratuito desarrollado por el profesor Laurence Anthony del Center for English Language Education in Science and Engineering (CELESE), School of Science and Engineering, Waseda University en Japón.
El programa, que no necesita de instalación (es un ejecutable que, una vez descargado, sólo ha de abrirse), ofrece las herramientas básicas de un programa de análisis y explotación de corpora, a saber: concordancias, listas de palabras más frecuentes, colocaciones, agrupaciones, n-gramas y lista de palabras clave.
Se ofrecen múltiples opciones de configuración, como el tipo de archivos (admite texto plano y lenguajes de marcado como HTML, HTM y XML), el uso de comodines para la búsqueda, opciones de ordenación alfabética, por frecuencias (de la palabra pivote y de las palabras contiguas a derecha e izquierda), búsqueda de palabras clave en contexto etc.
En este enlace podéis ver un breve tutorial en inglés de la herramienta. Además existe un ayuda online.
Yo misma he creado una guía presentación que os dejo aquí para que podáis empezar a utilizar la herramienta que, como veréis, es de lo más sencilla. De hecho, lo que más cuesta es recopilar un corpus lo suficientemente grande para conseguir resultados representativos, como el del Acquis de la UE.
Otra de las interesantes iniciativas que pude ver en la TeKom estos días pasados fue FOLT y en concreto la aplicación openTMS.

Forum Open Language Tools (FOLT) es un colectivo y un grupo de trabajo constituido por empresas de servicios pertenecientes a los sectores de la traducción y de la documentación.
Los principales objetivos de FOLT son el mantenimiento de formatos de intercambio estandarizados y de software sin propietario, así como la realización de pruebas con tecnologías y métodos de traducción nuevos. El objetivo es abarcar todo el flujo de trabajo de la documentación multilingüe. Para ello se analizan detalladamente los procesos en busca de lagunas y de falta de estándares, desde la redacción del texto de partida hasta su reproducción en las distintas lenguas.
Como resultado de estos esfuerzos, se pretende crear herramientas de software no propietario que le den la suficiente libertad al usuario como para no depender de una marca determinada. Los miembros de FOLT son fundamentalmente empresas alemanas, aunque es de esperar que cada vez se vayan uniendo más empresas a tal inciativa.

El primer producto de este grupo es openTMS, un software libre de código abierto que puede adquirirse sin costes de licencia. El lanzamiento de la versión 1.0 está previsto para octubre de 2009 (en la Tekom se presentó la versión Alfa).
La herramienta se basa por completo en estándares abiertos como XLIFF, TMX, TBX. El sistema está diseñado de manera modular, lo que le permite un alto grado de flexibilidad y adaptabilidad a cualquier proceso de traducción. Las especificaciones técnicas de la herramienta así como la presentación que se hizo en la TeKom están disponibles en la página web.
En fin, todavía es muy pronto para dar una opinión con respecto a la herramienta, ya que queda bastante hasta que veamos un producto acabado que poder probar y utilizar. Se trata, no obstante, de una loable iniciativa que podría hacer tambalear el mundo de la traducción y la localización si consigue ofrecer una alternativa seria y de confianza a los programas comerciales.
¿Qué os parece a vosotros?
Una de las novedades que se presentaron en la Jahrestagung 2008 de la Tekom fue Transit NXT, la nueva versión de la herramienta TAO del grupo suizo Star.
Después de más de 20 años de experiencia, por fin la empresa se digna a presentar una nueva versión con un lavado de cara bastante importante (al contrario que las anteriores versiones, que continuaban teniendo un aspecto poco amable y cuyo manejo estaba en muchas ocasiones muy lejos de los estándares de usabilidad y ergonomía deseados.
El aspecto de esta nueva versión nos recuerda mucho al lavado de cara que han sufrido las nuevas versiones del paquete Office de Microsoft, con menús no desplegables, sino agrupados en bloques.
De todas las novedades que el programa presenta, se destacan tres:
1. La posibilidad de tener una vista previa del documento en formato PDF, de forma que el traductor puede ver en la misma pantalla y sin tener que cambiar de aplicación, el aspecto que tendrá el texto meta.

2. La posibilidad de tener una vista previa del documento HTML , de forma que el traductor puede ver en la misma pantalla y sin tener que cambiar de aplicación, el aspecto que tendrá el texto meta.

3. Muchas más opciones para la localización de software, ya que cuenta con un editor que permite trabajar con archivos de recursos como DLL y EXE, así como mostrar los cuadros de diálogo tanto en la lengua origen como en la meta, adaptar el tamaño de éstos (“resizing”) y establecer límites en el número de caracteres.

Otra de las nuevas funcionalidades de esta nueva versión son las “Bubble Windows”, es decir, ventanas que desaparecen cuando no son necesarias. Esto se utiliza para los Fuzzy Matches: cuando hay, aparece la ventana y, una vez aceptadas o rechazadas las sugerencias, ésta desaparece.
La función Fuzzy Term en TermStar, la base de datos terminológica integrada, permite buscar términos con la técnica difusa.
Otra interesante función es el Dual Fuzzy, que se aplica para las traducciones. Normalmente todas las memorias de traducción, cuando buscan coincidencias, buscan en en la base de datos si hay una coincidencia del texto origen con otros textos guardados en la lengua origen. La ventaja del Dual Fuzzy es que, una vez encontrada una primera equivalencia, mira también si hay otras oraciones en la lengua meta que se parezcan, ya que muchas veces oraciones que se formulan de diferente manera en la lengua origen pero que tienen el mismo significado, se pueden formular de la misma forma en la lengua meta.
Hay un folleto, en el que se explican en detalle las características de la herramienta. El texto está en alemán y en inglés.
Asimismo, podéis ver demostraciones de todas estas funcionalidades en esta página e incluso a tutoriales de las diferentes opciones que hemos comentado (en el enlace e-learning). Aquí tenéis un ejemplo en el que se presenta la herramienta:
¿Y vosotros? ¿Conocíais esta herramienta? ¿Trabajáis con ella? ¿Cuál es vuestra experiencia? ¿Pensáis que esta nueva versión aportará beneficios reales?