Blog sobre Tecnologías de la Traducción y la asignatura Informática Aplicada a la Traducción

Esta semana va de herramientas… Aprovecho el curso que hice la semana pasada de Déjà Vu, sobre el que también tengo pensado hablaros, para presentaros esta herramienta que me dio a conocer el profe del curso, Ignacio Hermo (gracias, Nacho
.
Se trata de Intelliwebsearch, una herramienta desarrollada por Mike Farrell, traductor Italiano->Inglés.
Esta herramienta puede ahorrarnos mucho tiempo a la hora de buscar información en Internet sobre algún término o expresión que nos encontremos mientras traducimos, ya que lo que hace es buscar en varios recursos al mismo tiempo con sólo teclear una simple combinación de teclas. Se acabó abrir el navegador, abrir diferentes pestañas, teclear 10 veces el mismo término para encontrar un posible equivalente en 10 diccionarios diferentes…
Nos podemos bajar la herramienta desde este enlace. Una vez instalada, es recomendable configurar la aplicación, ya que por defecto hay muchos recursos IT-EN que no nos interesan necesariamente si trabajamos con otras lenguas. Para ello, al ejecutarla, se aloja como aplicación residente en nuestra barra de tareas (en Windows normalmente en el extremo derecho inferior de la pantalla), con un icono en forma de i de color rojo. Con el botón derecho vamos a la opción Configuración de búsqueda. Aquí aparece una lista de los diccionarios y recursos en los que podemos buscar por defecto, agrupados en Grupo 1, Grupo 2. Esto se hace para no buscar en 50 recursos al mismo tiempo. Por ejemplo, si trabajamos con dos lenguas extranjeras, podemos tener los 10 primeros recursos adscritos al grupo 1 y que busquen en páginas en la primera lengua extranjera, y el segundo grupo con recursos que busquen en la segunda lengua extranjera. Un tercer grupo pueden ser recursos monolingües en la lengua meta etc. Desde el menú Editar podemos añadir nuevos recursos, y haciendo doble clic sobre los mismos, editar las preferencias:

Después, en principio, son tres pasos los que tenemos que seguir:

Bien, estos son los pasos básicos para poder empezar a trabajar con la herramienta. Podéis encontrar más detalles en la Ayuda, disponible en francés y en
Y, ¿qué os parece? Práctico, ¿verdad?
La mayoría de herramientas de extracción de terminología son comerciales, como MultitermExtract o PhraseFinder de SDL. Sin embargo, de vez en cuando encontramos alguna herramienta gratuita como Lexterm, que permite extraer listados de términos a partir de textos, tanto monolingües, como bilingües. El corpus paralelo ha de ser un fichero de texto con un segmento original seguido de tabulador y del segmento traducido en cada línea. Así pues, si podemos exportar de la memoria de traducción o del archivo de alineación a formato txt en tabla, será suficiente.
La herramienta puede descargarse en este enlace, desde donde próximamente se anuncia la descarga de Libertra, un sistema de traducción asistida de código libre. Los autores hacen una presentación de la misma en este artículo.
La aplicación, que sólo tiene interfaz en catalán, se distribuye como un ejecutable para Windows que no necesita instalación. Así pues, sólo hemos de descargarnos el zip y descomprimirlo en el lugar donde queramos guardar la aplicación. Después bastará con crear un icono de acceso directo en el escritorio o en nuestro menú de Inicio.
Una vez abierto, podemos abrir textos monolingües o bilingües, siempre en formato txt (es decir, si tenemos archivos en otros formatos, habrá que convertirlos antes).
La herramienta permite también la aplicación de stop lists o listas de palabras vacías. Con el zip vienen tres, en inglés, catalán y español, y podéis encontrar otras en este enlace. La herramienta también nos permite limitar el número de n-gramas para la extracción, para que extraiga agrupaciones de 1, 2 y hasta 10 palabras.
Este sería un ejemplo de cómo deberíamos proceder para extraer candidatos de un corpus bilingüe:
Cuando se busca un equivalente de traducción siempre selecciona el más probable, pero es posible visualizar todos los posibles candidatos por orden de probabilidad. LexTerm también permite visualizar los contentos donde aparece el término original y traducido con el menú Cerca, seleccionando previamente el término. Esto puede ser de utilidad en caso de duda.
Una vez revisada la lista de candidatos y de equivalentes el resultado de la extracción se puede exportar a un formato de texto separado por tabuladores. Para exportar los términos, hemos de marcarlos en la lista. A partir de este formato se pueden introducir los términos en un sistema de gestión de terminología o importarlos en una base de datos terminológica de alguna herramienta de traducción asistida.
¡Espero que os sea de utilidad la herramienta…! Yo la he probado un par de veces y, aunque obviamente hay que revisar la lista, pensad en el trabajo que os ahorra si tuvierais que hacerlo de forma manual.

Últimamente, en la blogosfera traductoril, se han publicado varias entradas sobre las ventajas y desdesventajas de trabajar en plantilla o como autónomo… No creo que haya que añadir mucho más a lo que se ha dicho, así que me limito a listaros aquí los artículos al respecto:
Bien, creo que es todo. ¡Espero que disfrutéis las lecturas y saquéis algo en claro, sobre todo los que estáis a punto de ingresar en el mundo profesional de la traducción!
Los índices en Word nos pueden ayudar a crear una lista de palabra con las páginas en las que aparece. Esto es muy común en manuales y otro tipo de fuentes de referencia, que no se leen de forma lineal, sino que se consultan según el tema que nos interese. Así pues, el índice nos ayudará a localizar ese tema y averiguar en qué página se encuentra.
Como traductores, es importante conocer cómo se crean estos índices, ya que en ocasiones tendremos que traducirlos y, para ello, no habrá más remedio que crearlos de nuevo.
Para poder crear un índice, hemos de revisar el documento y encontrar las palabras clave que queremos que aparezcan en el mismo. Una forma sencilla de hacerlo, sin tener que leer todo el documento, puede ser hacer un análisis previo con una herramienta como AntConc, para ver qué palabras aparece con más frecuencia y son, por tanto, terminológicamente más significativas.
Hay dos maneras de hacer el índice, una manual y otra automática. Vamos a empezar con la forma manual:
Crear un índice de forma manual
Nos situamos en la primera palabra o expresión que queramos introducir en nuestro índice. La seleccionamos y después vamos al menú Insertar -> Referencia -> Índices y Tablas. En la ficha Índices pincharemos en la opción Marcar entrada (también se puede acceder directamente con el atajo Alt+Shift+X).

Aparece entonces un cuadro de diálogo en el que podemos ver en la casilla Entrada, el término que hemos seleccionado. Es posible también crear subentradas de la entrada principal. Éstas aparecerán debajo de la entrada principal y sangradas a la derecha y se utilizan cuando una entrada principal tiene términos estrechamente relecionados con ella que también aparecen en el documento. En Opciones podemos indicar si deseamos que se muestre en el índice una referencia cruzada o si queremos que se muestre la referencia a una pagina o intervalo de paginas. Asimismo, podemos hacer que el número de página tenga el formato de negrita y/o cursiva.

A continuación podemos elegir Marcar o Marcar todas, para marcar, respectivamente, sólo esa palabra o expresión o todas las que aparezcan en el documento. Veremos entonces que se ha introducido una marca de índice entre paréntesis. Si nos molestan, podemos ocultarlas con la opción Mostrar u ocultar marcas de párrafo, que normalmente aparece con un icono en forma de P invertida en nuestra barra de herramientas. A la hora de imprimir o trabajar con el documento las marcas no afectan en nada al texto ni a su maquetación.
Para seguir marcando el resto de entradas, no es necesario cerrar este cuadro de diálogo. Nos iremos moviendo por el documento y buscando las palabras que nos interesen, para después repetir los pasos que hemos comentado. Cuando terminemos de marcar todas las entradas, pulsaremos en Cancelar.
Crear un índice de forma automática
Vamos ahora a ver una forma diferente de crear el índice. Para ello necesitamos otro documento en el que crearemos una tabla de dos columnas. En la primera columna insertaremos una fila por cada término o expresión que queramos introducir en nuestro índice. Es importante que estén escritos de forma idéntica a como están escritos en el documento, si no no los reconocerá. En la segunda columna podremos el texto que queremos que aparezca en el índice final. En general, pues, coincidirán la primera y la segunda columna. Si queremos que haya subentradas, en la segunda columna podemos hacerlo poniendo dos puntos tras la entrada principal y después la subentrada.
Una vez finalizada la tabla, guardaremos y cerraremos el documento de forma normal. Después vamos de nuevo a Insertar -> Referencia -> Índices y Tablas y seleccionamos ahora la opción Automarcar. Aparece entonces un diálogo para seleccionar el fichero donde tenemos el listado. Seleccionamos el fichero que hemos creado y pulsamos Abrir. Se marcarán de forma automática todas las entradas de nuestra tabla.
Insertar el índice en nuestro documento
Por último, una vez tenemos todas las marcas ya definidas bien haya sido manual o automáticamente podemos crear el índice.
Nos situamos en el lugar del documento donde queramos introducirlo (normalmente al final).
Accedemos al menú Insertar – Referencia – Índice y tablas y aparecerá un cuadro de diálogo Índice y tablas como el que vemos en la imagen. Accedemos ahora de nuevo al menú Insertar – Referencia – Índice y tablas. A continuación sólo tenemos que configurar las opciones de apariencia del índice (p.e. si las subentradas han de aparecer de forma continua o con sangría, si los números se han de alinear a la derecha, las columnas en las que ha de aparecer el índice, el estilo etc.) y terminamos haciendo clic en Aceptar, lo que generará el índice.

Cómo traducir los índices índice en nuestro documento
Ahora vamos a ver qué opciones tenemos para traducir los índices. Tenemos básicamente dos opciones:
¿Alguna idea más? ¿Os habéis enfrentado alguna vez a este problema? ¿Cómo lo habéis resuelto?
Os voy a presentar una de las herramientas que utilizo en clase para que los alumnos aprendan cómo explotar sus propios recursos documentales.
Se trata de AntConc (versión 3.2.1), un software gratuito desarrollado por el profesor Laurence Anthony del Center for English Language Education in Science and Engineering (CELESE), School of Science and Engineering, Waseda University en Japón.
El programa, que no necesita de instalación (es un ejecutable que, una vez descargado, sólo ha de abrirse), ofrece las herramientas básicas de un programa de análisis y explotación de corpora, a saber: concordancias, listas de palabras más frecuentes, colocaciones, agrupaciones, n-gramas y lista de palabras clave.
Se ofrecen múltiples opciones de configuración, como el tipo de archivos (admite texto plano y lenguajes de marcado como HTML, HTM y XML), el uso de comodines para la búsqueda, opciones de ordenación alfabética, por frecuencias (de la palabra pivote y de las palabras contiguas a derecha e izquierda), búsqueda de palabras clave en contexto etc.
En este enlace podéis ver un breve tutorial en inglés de la herramienta. Además existe un ayuda online.
Yo misma he creado una guía presentación que os dejo aquí para que podáis empezar a utilizar la herramienta que, como veréis, es de lo más sencilla. De hecho, lo que más cuesta es recopilar un corpus lo suficientemente grande para conseguir resultados representativos, como el del Acquis de la UE.