jueves, 15 de noviembre de 2012

Bitext2TMX y ParaConc

En clase hemos aprendido a utilizar estos dos herramientas, desconocidas para mí. Me han parecido dos programas bastantes útiles que pueden ahorrarnos mucho tiempo y, al mismo tiempo, facilitar nuestra tarea. Además, no me han parecido muy difíciles de utilizar, cualquier puede ser capaz de comprenderlos.
Bitext2TMX es un alineador de textos de código abierto. Nos ayuda a comparar el texto de origen y su traducción, haciendo coincidir los segmentos correspondientes y uniéndolos. Estos corpus paralelos son la base de las memorias de traducción.
¿Qué pasos debemos seguir para alinear nuestros dos textos? Antes de nada, debemos comprobar que el texto de origen y el texto meta tienen el mismo formato de archivo. A continuación, especificaremos el formato de entrada y las lenguas de origen y llegada. Después de seleccionar nuestros dos archivos y completar el proceso, nos aparecerán dos columnas: a la izquierda veremos el texto original y a la derecha, nuestros texto traducido. Algo parecido a esto:

http://pmdtrad.files.wordpress.com/2012/03/segmentacion.jpg

Por último, debemos guardar el resultado en el formato que permita la memoria de traducción que vayamos a utilizar.
Estos alineadores también pueden usarse como un diccionario terminológico o como una fuente para conocer el índice de frecuencia de uso de las palabras en un texto.

Bitext2TMX puede descargarse aquí.

ParaConc es un alineador de corpus con función bilingüe o multilingüe. En clase hemos utilizado una versión demo, que solo puede ser usada 150 veces y, además, sus resultados no pueden guardarse ni imprimirse. Tanto la versión de pago como la gratuita pueden adquirirse en su web


Algunas de sus funciones son:

- Load Corpus File: se añaden los textos (siempre en formato .txt) que se quieren comparar.
- Corpus Alignment: aquí podemos ver la comparación de ambos textos, con algunas frases paralelas subrayadas y en diferentes colores.
- Frequency Options: aquí podemos ver la lista de palabras que aparecen el texto, ordenadas por su frecuencia. También tenemos la opción de añadir una lista de stopwords, palabras que no deseamos que sean tenidas en cuenta (por ejemplo las preposiciones).
- Search: esta herramienta nos sirve para buscar una palabra determinada en los textos y, mediante la opción KWIC (Key Word In Context), veremos los segmentos en los que aparece el término.

Para más información sobre sus diferentes funciones puede consultarse este tutorial en inglés.

No hay comentarios:

Publicar un comentario