Los LLM (Modelo extenso de lenguaje, traducido de sus siglas en inglés) son un hot topic a día de hoy. Aplicaciones como ChatGPT hacen uso de sus funcionalidades para mejorar la comunicación entre los sistemas de IA y nosotros… pero, ya que tanta importancia tiene para nuestra experiencia digital, ¿qué son realmente los LLM?
Nuestra experiencia vital a la hora de adquirir conocimientos como humanos se basa en el aprendizaje. Gracias a la evolución de nuestra especie, somos capaces de procesar, comprender y memorizar una situación de cualquier tipo para obtener referencias en el futuro utilizando nuestra memoria. Bien, pues un sistema LLM actúa muy parecido a nuestro sistema intelectual.
Qué es un LLM
En esta ocasión, hablamos de un tipo de IA programada para procesar, comprender y generar texto de la manera más parecida posible a como lo haría una persona. Estos sistemas están basados en redes neuronales, al igual que nuestro intelecto, para procesar y aprender de grandes volúmenes de datos. Esto quiere decir que en su haber posee conocimiento de, por ejemplo, las grandes obras literarias de la historia de la humanidad o los descubrimientos científicos que más progreso han traído a la civilización. Además, su capacidad de aprendizaje de patrones y relaciones entre conceptos hace que su funcionamiento se perfeccione de manera ininterrumpida para ofrecer resultados más óptimos al usuario final.
El ejemplo más sonado de un sistema de IA que alberga esta arquitectura la encontramos en la modalidad GPT-4 de ChatGPT.
El epicentro de un sistema LLM es el diseño conocido como «transformer«. Puede recordarte a cierta película, pero no tiene nada que ver (de momento). Este modelo disecciona cada palabra por separado y observa su interacción con el resto de ellas. Así, mediante su etapa de «entrenamiento», el modelo aprende a predecir la próxima palabra dentro de un contexto específico. Si detecta respuestas repetidas millones de veces en base a diferentes fuentes, la aplicará como el modelo válido a seguir. En este tipo de funcionalidad, no hablamos de un parámetro, ni de cientos, sino que un sistema LLM tiene en cuenta miles de millones de parámetros para optimizar su lenguaje y obtener una base de datos de aprendizaje.
Los sistemas LLM los podemos encontrar hoy en día en múltiples sectores que están aprovechándose de esta revolucionaria funcionalidad. Por ejemplo, asistentes virtuales como Alexa o Siri ya disponen de este modelo para interpretar las órdenes y solicitudes de los usuarios. Algunos servicios de atención al cliente, como los de ciertas instituciones bancarias, se encuentran regidos por esta tecnología para ejercer servicios a nivel telefónico.
Pero no es oro todo lo que reluce, pues este avance fundamental en el lenguaje de la IA también conlleva ciertas barreras que han de ser pulidas para ejercer un progreso tecnológico adecuado. Al basarse en conocimiento humano real, este lenguaje puede adquirir por accidente ciertos prejuicios preestablecidos en las obras originales, por lo que es un desafío añadido a su construcción. Por otra parte, su funcionamiento requiere de una inmensa cantidad de energía para procesar tal cantidad de datos, y esto conlleva un impacto directo sobre el medioambiente, cuyos únicos responsables son los humanos.
A pesar de estos desafíos, como usuario del entorno digital, sigo teniendo la sensación de que nos hallamos en los primeros pasos de una revolución tecnológica en la que, gracias a proyectos como el que hemos traído en este artículo, supondrán un antes y un después en el progreso de nuestra civilización.