Por qué es posible que pierdas tu trabajo, y es bueno que así sea (1ª parte): Cuando Google inventó los Transformers

En 2017 Google publicó un paper científico en el que hablaba de una nueva tecnología: los transformers. El mundo cambió para siempre.

La IA es una rama de la informática que se ocupa de crear sistemas que imitan la inteligencia humana. La IA se basa en algoritmos, generalmente redes neuronales, que son unas secuencias de pasos que siguen las máquinas para realizar una tarea. La IA se puede clasificar en diferentes tipos, según el nivel de inteligencia y el ámbito de aplicación de los sistemas. Algunos tipos de IA son la IA débil, que es la que solo puede hacer una tarea específica, como reconocer caras, la IA fuerte, que es la que puede hacer varias tareas y razonar sobre ellas, como jugar al ajedrez, y la IA general, que es la que puede hacer cualquier tarea que hace un humano, pero que todavía no existe. La IA usa técnicas como el aprendizaje automático, que es la capacidad de las máquinas de aprender de los datos, y la IA explicable, que es la capacidad de las máquinas de explicar cómo hacen las cosas.

Hasta 2017 las redes neuronales más usadas se llamaban RRN (redes recurrentes) y CNN (convolucionales), entonces Google inventó la tecnología Transformer y todo cambió.

Los transformers se diferencian de otros tipos de redes neuronales porque no procesan el lenguaje de forma lineal o secuencial, es decir, palabra por palabra, sino que pueden prestar atención a todas las palabras de una frase o un texto al mismo tiempo, y así captar mejor el significado y el contexto. Esto les permite realizar tareas como traducir, resumir, generar o clasificar textos de forma más rápida y precisa que otros modelos.

Por ejemplo, en la oración: «Ella sirvió agua de la jarra a la taza hasta que se llenó»

Sabemos que «se» se refiere a la taza, mientras que en la oración: «Ella sirvió agua de la jarra a la taza hasta que se vació»

Sabemos que «se» se refiere a la jarra.

Eso solo es posible si analizas la frase en su globalidad, no si vas mirando palabra a palabra.

Lo mismo se puede aplicar si analizas una foto: un círculo rojo puede ser un sol, o una pelota, no lo sabes si no analizas el resto de la foto. E igual sucede con vídeos, y con cualquier información donde el significado de algo dependa mucho de su contexto.

De ahí lo revolucionario de esta tecnología, tan revolucionario que en apenas 5 años ha cambiado el mundo, y en los próximos 5 lo pondrá todo patas arriba. Pero de eso hablaremos en el próximo artículo.

Más Historias Faro