TERMCAT


Aprovecho la noticia de que el TERMCAT acaba de publicar un nuevo diccionario en línea, la Terminologia dels videojocs, para hablaros de los recursos que ofrece esta institución.

Entre otros muchos servicios, para un traductor se ofrecen tres recursos fundamentales: el Cercaterm (entrar con el nombre de usuario y cotraseña que aparecen por defecto), que permite realizar consultas terminológicas en varias lenguas por medio del módulo de respuesta automática; los Diccionarios en línea, que cubren temas tan variados como los videojuegos, la enfermería, la gastronomía japonesa o el léxico del transporte turístico; y la Terminologia Oberta, compuesta por repertorios de terminología general, procedentes de trabajos de investigación terminológica llevados a cabo por el TERMCAT y que pueden bajarse libremente en formato XML. Prácticamente estos repertorios terminológicos son los mismos que los diccionarios en línea.

Si os bajáis alguno de ellos, podéis abrirlos desde Excel y se convertirá en formato tabla. En este enlace, el traductor Timothy Barton explica como convertir esta tabla a un formato apropiado para ser exportado a un gestor de bases de datos terminológicos como Multiterm.

En cuanto al diccionari de videojocs, éste recoge cerca de 300 denominaciones con definición y notas en catalán y equivalencias en castellano, francés e inglés. Hay términos referentes a la creación y la programación, a los dispositivos de juego y la tipología de videojuegos, a la interacción y a las comunidades de jugadores o a la industria de los videojuegos.

En este caso además la modalidad de consulta se amplia en este caso a un formato singular: un videojuego que permite jugar con la terminología incluida y que pretende facilitar la difusión de las formas catalanas entre la comunidad de usuarios. Además, se ofrece también la posibilidad de descargar libremente la terminología que permite obtener todas las denominaciones de los videojuegos en formato XML bajo una licencia de uso flexible. Este diccionario forma parte de la colección Diccionaris en Línia, disponible en el web de TERMCAT, que recoge terminología específica sobre distintos ámbitos de especialidad, como el recién publicado Diccionari d’infermeria, fruto de la colaboración entre las instituciones enfermeras del ámbito lingüístico catalán, el Departamento de Salud de la Generalitat de Catalunya y TERMCAT.

Sin duda un recurso interesante no sólo para los que trabajan con el catalán como lengua materna, sino también con el español, el inglés o el francés al contener estos repertorios terminológicos equivalentes en estas lenguas.

Jan
24

Ana

Acabo de encontrar este vídeo en YouTube y me ha llamado mucho la atención. Se trata de un nuevo sistema desarrollado por la empresa IBM mediante el cual podemos hablar y traducir lo que decimos a lenguaje de signos mediante un personaje de animación 3D.

SiSi (Say it Sign it) utiliza la tecnología de reconocimiento del habla para convertir el discurso oral en texto, tras lo cual este texto se traduce en lenguaje de signos que interpreta un avatar. El vídeo ya tiene un tiempo (aprox. 1 año), pero aún así me parece algo bastante novedoso, aunque por ahora sólo está disponible como prototipo experimental y para la lengua de signos británica. En todo caso, es un gran paso hacia la integración de las personas con discapacidad auditiva, dotándoles de mayor independencia y confidencialidad al no necesitar siempre un intérprete.

Hoy hablaremos de otra herramienta de traducción asistida: OmegaT. Este software libre y además gratuito permite la gestión de memorias de traducción y de glosarios terminológicos, e incluye otra serie de utilidades que pueden descargarse como un alineador de textos o un convertidor de textos alineados en formato TMX para su importación en una memoria. El programa principal puede descargarse en este enlace.

Una de las ventajas de este programa es que, al igual que Wordfast, es multiplataforma, es decir, existen versiones para Windows, Linux y Mac, además de una versión para aquellos desarrolladores que quieran seguir mejorando el programa.

Hay una especie de “manual de usuario” muy útil en http://atraducir.info/omegat/ además de una lista de correo en la que se anuncian novedades y se resuelven dudas sobre esta aplicación.

OmegaT tiene las siguientes características:

* Coincidencias parciales
* Propagación de coincidencias
* Procesado simultáneo de proyectos con archivos múltiples
* Uso simultáneo de múltiples memorias de traducción
* Glosarios externos
* Formatos de archivos:
XHTML y HTML
Microsoft Office 2007 XML
OpenOffice.org/StarOffice
XLIFF (Okapi)
MediaWiki (Wikipedia)
Sólo texto
* Soporte Unicode (UTF-8): puede utilizarse con alfabetos no latinos
* Soporte para idiomas derecha-izquierda
* Compatible con otras aplicaciones de memoria de traducción (TMX)

Creo que entre todas estas características cabe destacar fundamentalmente dos: el hecho de que utilice TMX como formato de memoria, lo que permite la compatibilidad con otras herramientas TAO, y el que ahora pueda traducir archivos generados en Office 2007, lo que facilita la labor a aquéllos que disponen de este software propietario sin necesidad de convertir los archivos para ser leídos en OpenOffice.

Si bien este software no es tan sofisticado ni ofrece tantas funcionalidades como otras aplicaciones comerciales, puede ser una buena opción para introducirse en el mundo de las herramientas TAO sin necesidad de una gran inversión (al menos de dinero).

Os dejo aquí un tutorial en tres partes de cómo empezar a utilizar OmegaT. Espero que os sea de utilidad. ¿Alguien trabaja de forma regular con OmegaT? ¿Cuál es su experiencia?

Jan
15
Filed Under (Cursos, Formación) by Laura on 15-01-2009

Leo en varias listas de distribución (Infotrad, Traducción en España) que está abierta la convocatoria para apuntarse al curso en línea de Trados. Os copio aquí la informacion:

Curso on line de Trados en SIC. *** Traducción asistida con Trados *** Fechas: 23 de enero a 23 de marzo de 2009 Duración estimada: 120 horas Metodología: El curso se imparte íntegramente a través de la plataforma educativa virtual de SIC. Importe: 490 Euros Importe para los miembros de la lista: 441 Euros Es posible consultar los detalles de esta edición, solicitar la guía informativa del curso o matricularse desde nuestra página web (www.torsimany.com) o por correo electrónico (cursos@torsimany.com).

El curso, como veis, está organizado por SIC, una empresa dedicada a la asesoría y formación en nuevas tecnologías para profesionales del sector lingüístico. Aunque el precio pueda parecer algo caro en principio (aunque también ofrecen importantes descuentos por matrícula anticipada y membresía en listas, como las arriba citadas) y quizá para los que tenemos alma autodidacta no valga mucho la pena, sí me han comentado que los cursos están muy bien organizados y el contenido es interesante y está actualizado. Además de los cursos en línea tienen cursos presenciales en sus oficinas de Barcelona. Para 2009 ofrecen, en la modalidad presencial, cursos de Iniciación a Trados, Traducción con Trados, Productividad en traducción, Comparativa de programas de traducción asistida, Traducción de páginas web con Trados, Cómo hacer un presupuesto de traducción con Trados y Memorias de traducción. En cuanto a los cursos en línea, los temas tratados serán Traducción asistida con Wordfast, Terminología – Obtención y gestión, Traducción asistida con SDL Trados, Traducción de páginas web, Buscar recursos lingüísticos en Internet, Gestión de bases de datos terminológicas con MultiTerm, Fiscalidad para traductores y correctores, y Crear una memoria de traducción, un curso gratuito que para los que se introducen en el mundo de las herramientas TAO puede resultar interesante.

¿Alguien ha seguido un curso en SIC? ¿Cuál es vuestra experiencia?


Jan
14
Filed Under (Herramientas TAO, Marcas, Software, Wordfast) by Laura on 14-01-2009

Wordfast

El pasado día 1 de enero Wordfast lanzó una primera versión de Wordfast Professional 6.0. Al contrario que las versiones anteriores, que utilizaban el editor de MS Word para trabajar,  la nueva aplicación está basada en Java y, por ello, es independiente y multiplataforma. Es decir, tanto los usuarios de Windows como los de Mac OS X y Linux podrán trabajar con ella (hay que añadir aquí que la última versión de Classic, 5.53q, parece ser que también funcionaba ya para Mac y Linux). 

La última versión 6.0 puede descargarse desde el sitio de la empresa junto con una licencia de prueba cuya duración expira el 31 de enero de 2009. Así que si queréis probarla, ¡no tardéis mucho! La ayuda la tenéis en este enlace.

Vamos a repasar las ventajas de esta nueva aplicación:

  • Como hemos comentado, es multiplataforma, así que no está sólo limitada a los usuarios de WIndows.
  • Otra de las ventajas importantes es que podrán traducirse más formatos: doc, .ppt, .xls (es decir, Word 97/2003) y txml (un formato propietario de Wordfast). Asimismo, parece ser que está previsto, aunque en los foros se afirma que ya están disponibles, que puedan leerse otros formatos como .html, .xml, .asp, .inx, .jsp e incluso .mif, aunque la versión que yo me he bajado no los incluye todavía.
  • Una interfaz más intuitiva, con la posibilidad de personalizarla (aunque no he trabajado todavía mucho con la herramienta, se parece sospechosamente mucho a la de DVX).
  • Control de calidad automático, incluyendo ortografía. No sé si más tarde incluirán otros controles como la consistencia terminológica o el control de etiquetas.
  • Compatibilidad con el formato TMX y por tanto, con otras múltiples herramientas TAO (aunque he de confesar que yo no he encontrado manera de convertir las memorias que se generan en formato jtx a TMX).

Cabe destacar que la herramienta está todavía lejos de su madurez, como lo demuestran los asuntos por tratar que aparecen en la página web de la empresa. De hecho, la empresa piensa seguir manteniendo la versión Classic, que trabaja directamente en MS Word, y desarrollarla paralelamente con esta versión, hasta que esté plenamente madura o los usuarios empiecen a dejar de utilizar el editor de Word como herramienta de traducción.

En fin, veremos qué repercusión tiene esta versión. Sin duda, Wordfast cuenta con el beneplácito de la comunidad de traductores, sobre todo los autónomos, y esperamos que esta versión traiga mejoras reales que les ayuden a ser más efectivos en su trabajo (porque eficaces ya sé que lo son :) y que el señor Yves Champollion no nos decepcione…

Jan
14

Empezaré confesando que ya sé que tenía el blog un poco abandonadillo, pero este último mes ha sido una locura y me ha sido imposible tomarme un tiempo para escribir alguna entrada de contenido más o menos decente… En fin, ahora que llega el final del cuatrimestre y las cosas se empiezan a relajar un poco, espero (aunque no prometo) poder volver a dedicarle algo más de tiempo e ir agregando nuevas entradas.

XLIFFEmpezaremos con algo sencillito, hoy hablaré de estándares, y en concreto de XLIFF (XML Localization Interchange File Format). Se trata de un formato basado en XML creado como estándar de localización.

Fue OASIS (Organization for the Advancement of Structured Information Standards) en 2002 quien propuso este estándar y en la actualidad puede verse la última versión de la especificación ( v1.2 del 01/02/2008) en este enlace.

En este artículo se explican las ventajas de este formato. Hoy en día los traductores debemos tratar con multitud de formatos diferentes, desde doc hasta formatos de maquetación como FrameMaker o Quark Xpress, pasando por archivos de recursos de software, que pueden ser tan diferentes como .properties, .po, .msg, .java, etc.  XLIFF se basa en la idea de la separación de contenido y formato para la traducción, simplificando así el proceso de traducción: del documento original se extraen, por una parte, los contenidos que se van a traducir (translation units) y, por otra, todos los elementos que no son traducibles (skeleton).Una vez realizada la traducción se vuelven a unir estos elementos para formar el documento final. Esto, por un parte tiene, la ventaja técnica de, como hemos mencionado, no tener que trabajar con multitud de formatos y enfrentarse a posibles problemas derivados de la no protección de etiquetas o la falta de espacio; no obstante, por otra parte, nos enfrentamos al problema de la descontextualización, al no contar con el documento original tal y como se concebió. Así pues, es recomendable, aunque nos den el texto en XLIFF, pedir el documento original o su versión en PDF como referencia.

Si os preguntáis cuál es la diferencia con TMX, estándar que ya vimos anteriormente, es que XLIFF aporta innovaciones con respecto al intercambio de información en web, además de aportar facilidades para la gestión de flujo o el control de versiones. De hecho, la información proporcionada es mucho más amplia: por un lado el número de palabras de cada segmento; por otro, información de uso de la memoria de traducción (p.e. el estado del segmento), datos de un glosario si se hubiera utilizado, información de contexto (y comentarios…) y de revisión (el estado de aprobada o rechazada (state=”user:approved” o state=”user:rejected”) de la traducción del segmento por un posiblerevisor en el proceso). Los documentos XLIFF suelen tener la extensión .xlf, o .xlz si están comprimidos.

En cuanto al flujo de trabajo con documentos XLIFF, el cliente puede generar archivos XLZ con conversores de formato como OLT XLIFF Filters (una herramienta de Open Language Tools de Sun Microsystems) desde archivos, digamos, en HTML, simplemente seleccionando y arrastrando el archivo a la ventana de la aplicación:

Se generará entonces un archivo comprimido, como hemos dicho, que contendrá a su vez tres archivos: workflow.properties, skeleton.skl (con la información que permitirá recuperar el formato original) y content.xlf.

Después el traductor traduce el archivo XLF con algún editor específico como XLIFF Translation Editor:

XLIFF Editor

Una vez traducido y hechas las modificaciones pertienentes (comentarios, glosario etc.), se exporta el archivo y se genera de nuevo el fichero traducido en el formato original, así como una memoria de traducción y un glosario si se hubiera creado.

Este artículo del profesor experto en software libre para la traducción Juan Rafael Fernández García, explica de manera detallada el proceso de traducción con XLIFF y hace una interesante reflexión sonre este formato frente a otros formatos libres para la localización como PO, que hasta ahora se mantiene como estándar. Se discuten diferentes aspectos que pueden haber contribuido a que XLIFF no se haya establecido tal y como se esperaba, aunque se dan también algunas pistas con respecto a lo que puede depararnos el futuro.

Asimismo os recomiendo el enlace de OpenTag sobre XLIFF. OpenTag es un sitio dedicado a herramientas y tecnologías libres para la localización de software, ayuda en línea y documentación, que pretende proporcionar información de interés para mejorar los procesos de localización.