Uno podría pensar que detrás
del traductor hay un grupo de personas actualizando las reglas gramaticales que
están en constante evolución o una base de datos con libros de gramática
y diccionarios. Pues no, en realidad el famoso traductor hace su trabajo en
base a la estadística, economía y un poco de matemáticas.
En la actualidad uno de los principales objetivos de las
grandes corporaciones es superar la barrera del idioma. Ya son varios años
desde que las compañías se disputan el primer lugar para desarrollar el traductor
definitivo de idiomas. Google a la cabeza, IBM y Microsoft son los principales
titanes que disputan tal batalla. Cada uno lucha a su manera con herramientas como
inteligencia artificial, estadística y grandes bases de datos pero no de
diccionarios, le dan prioridad a lo práctico: libros, conversaciones, guiones,
etc.
Ya que el traductor
de la firma Google (lleva a cabo más de mil millones de traducciones al día) es
el más utilizado nos centraremos en el para ver cómo es que funciona y si eres
de los usuarios que le gusta exprimirlo al máximo, te darás cuenta del porqué
de los errores que llega a cometer.
Aunque parezca impresionante, el equipo encargado en
desarrollar este traductor no cuenta con lingüistas ni filólogos. El director
de investigación de Google (Peter Norvig) comenta que elaborar la programación para
enseñarle a un sistema las reglas de los más de 80 idiomas en base a su gramática
y de cómo se traducen entre sí es una tarea casi imposible dada la evolución y excepciones
que integra cada uno de ellos.
Para superar los problemas lingüísticos que surgen de excepciones
y de los cambios del idioma, el equipo de investigación opto por trabajar en
base a estadística. Elaboraron una base de datos que recopila miles de millones
de frases y millones de textos traducidos a los idiomas con los que trabaja el
sistema. De este modo el sistema genera un patrón de traducción y recopila
frases o bloques de texto para hacer la interpretación.
Ahora sabemos cómo es que el traductor llega a tener errores,
en algunos casos, por la falta de puntos, comas, símbolos y signos de expresión
en los textos a traducir. Los investigadores afirman que cada vez están más
cerca de evitar esos problemas ya que mantienen un proceso de mejora continua. Día
a día las bases de datos son actualizadas con textos traducidos por expertos.
Dado que el traductor trabaja con más de 80 idiomas, suponemos que debe haber más de 6400 traducciones
en su base de datos por cada frase, palabra o bloque de texto, correspondiente
a las combinaciones que se pueden generar entre cual y cual idioma se quiere a
traducir. Pues así NO trabaja el intérprete.
Cuenta con un mecanismo muy
eficiente: no traduce directamente entre idiomas. Tiene como base el idioma
Ingles; por ejemplo: si quisiera traducir de español a francés no lo hace
directamente, lo que hace es una traducción del texto en español a inglés y del
inglés pasa al francés. Este subproceso reduce las combinaciones posibles de unas
6400 a tan solo 240 aproximadamente por cada frase, palabra o bloque de texto. Sorprendente
¿no?
El mecanismo que utiliza Google en su traductor no es nuevo,
se utiliza ampliamente en los aeropuertos y centrales de autobuses. Es la forma
más eficiente que tienen las aerolíneas para coordinar sus vuelos y se trata
del paradigma de distribución radial. Por
ejemplo:
Supongamos que una aerolínea debe coordinar un vuelo diario
entre 20 ciudades, se necesitarían 40 vuelos; 20 de ida y 20 de regreso. El
paradigma de distribución radial consiste en llevar los vuelos a un punto medio
y de éste punto a su destino final, de esta manera se reducen considerablemente
la cantidad de vuelos que se necesitan para llevar a cabo la coordinación. Por
eso es que son tan populares los transbordos en las aerolíneas y otras redes de
transporte.
Paradigma de distribución ó Spoke-hub |
Cabe mencionar otro gran motivo por lo que Google utiliza el
mencionado paradigma en sus interpretaciones y es que se le hace fácil alimentar
su base de datos de “x” idioma al inglés
y viceversa que las traducciones directas entre idiomas. Visto de esta manera
ya todo es más sencillo así que en resumen el todo poderoso del Internet tiene en
su base de datos entradas o salidas en inglés y las relaciona entre los
distintos idiomas.
Con todo y sus fallas, el traductor sigue siendo una
herramienta útil y haciendo una reflexión, si tuviera otro método de interpretación
lo más probable es que no estaría con nosotros.
No hay comentarios.:
Publicar un comentario