martes, 13 de mayo de 2014

Así Funciona el Traductor de Google


Así Funciona el Traductor de Google


Uno podría pensar que detrás del traductor hay un grupo de personas actualizando las reglas gramaticales que están en constante evolución o una base de datos con libros de gramática y diccionarios. Pues no, en realidad el famoso traductor hace su trabajo en base a la estadística, economía y un poco de matemáticas.



En la actualidad uno de los principales objetivos de las grandes corporaciones es superar la barrera del idioma. Ya son varios años desde que las compañías se disputan el primer lugar para desarrollar el traductor definitivo de idiomas. Google a la cabeza, IBM y Microsoft son los principales titanes que disputan tal batalla. Cada uno lucha a su manera con herramientas como inteligencia artificial, estadística y grandes bases de datos pero no de diccionarios, le dan prioridad a lo práctico: libros, conversaciones, guiones, etc.


Así Funciona el Traductor de Google 2


Ya que el traductor de la firma Google (lleva a cabo más de mil millones de traducciones al día) es el más utilizado nos centraremos en el para ver cómo es que funciona y si eres de los usuarios que le gusta exprimirlo al máximo, te darás cuenta del porqué de los errores que llega a cometer.

Aunque parezca impresionante, el equipo encargado en desarrollar este traductor no cuenta con lingüistas ni filólogos. El director de investigación de Google (Peter Norvig) comenta que elaborar la programación para enseñarle a un sistema las reglas de los más de 80 idiomas en base a su gramática y de cómo se traducen entre sí es una tarea casi imposible dada la evolución y excepciones que integra cada uno de ellos.

Para superar los problemas lingüísticos que surgen de excepciones y de los cambios del idioma, el equipo de investigación opto por trabajar en base a estadística. Elaboraron una base de datos que recopila miles de millones de frases y millones de textos traducidos a los idiomas con los que trabaja el sistema. De este modo el sistema genera un patrón de traducción y recopila frases o bloques de texto para hacer la interpretación.

Ahora sabemos cómo es que el traductor llega a tener errores, en algunos casos, por la falta de puntos, comas, símbolos y signos de expresión en los textos a traducir. Los investigadores afirman que cada vez están más cerca de evitar esos problemas ya que mantienen un proceso de mejora continua. Día a día las bases de datos son actualizadas con textos traducidos por expertos.

Dado que el traductor trabaja con más de 80 idiomas,  suponemos que debe haber más de 6400 traducciones en su base de datos por cada frase, palabra o bloque de texto, correspondiente a las combinaciones que se pueden generar entre cual y cual idioma se quiere a traducir. Pues así NO trabaja el intérprete. 

Cuenta con un mecanismo muy eficiente: no traduce directamente entre idiomas. Tiene como base el idioma Ingles; por ejemplo: si quisiera traducir de español a francés no lo hace directamente, lo que hace es una traducción del texto en español a inglés y del inglés pasa al francés. Este subproceso reduce las combinaciones posibles de unas 6400 a tan solo 240 aproximadamente por cada frase, palabra o bloque de texto. Sorprendente ¿no?

El mecanismo que utiliza Google en su traductor no es nuevo, se utiliza ampliamente en los aeropuertos y centrales de autobuses. Es la forma más eficiente que tienen las aerolíneas para coordinar sus vuelos y se trata del paradigma de distribución radial. Por ejemplo:

Supongamos que una aerolínea debe coordinar un vuelo diario entre 20 ciudades, se necesitarían 40 vuelos; 20 de ida y 20 de regreso. El paradigma de distribución radial consiste en llevar los vuelos a un punto medio y de éste punto a su destino final, de esta manera se reducen considerablemente la cantidad de vuelos que se necesitan para llevar a cabo la coordinación. Por eso es que son tan populares los transbordos en las aerolíneas y otras redes de transporte.


Así Funciona el Traductor de Google 3
Paradigma de distribución ó Spoke-hub



Cabe mencionar otro gran motivo por lo que Google utiliza el mencionado paradigma en sus interpretaciones y es que se le hace fácil alimentar su base de datos  de “x” idioma al inglés y viceversa que las traducciones directas entre idiomas. Visto de esta manera ya todo es más sencillo así que en resumen el todo poderoso del Internet tiene en su base de datos entradas o salidas en inglés y las relaciona entre los distintos idiomas.


Con todo y sus fallas, el traductor sigue siendo una herramienta útil y haciendo una reflexión, si tuviera otro método de interpretación lo más probable es que no estaría con nosotros. 

No hay comentarios.:

Publicar un comentario