Uno de los componentes que más han tenido que ver en la expansión de las Inteligencias Artificiales han sido las LLMs. ¿Qué son y por qué son tan importantes? Te lo explicamos.
LLM es el acrónimo de Large Language Models. En español no hay una traducción única, y se puede traducir como Modelos de Lenguaje Extenso, Modelos de Lenguaje de Gran Tamaño o Modelos de Lenguaje Grandes.
Son unos tipos de software de Inteligencia Artificial diseñados para el procesamiento de lenguaje natural (NLP), que consta de comprensión del lenguaje (NLU) y generación de lenguaje (NLG).
Están basados en aprendizaje automático y se crean con unas redes neuronales llamadas transformadores. La base de los transformadores se creó en un paper del 2017 de Google llamado Attention Is All You Need. Más tarde, en 2018, OpenAI sacó un paper en el que desarrollaron cómo entrenar una LLM con un dataset masivo y luego ajustarlo Improving Language Understanding by Generative Pre-Training. En 2020 sacaron Language Models are Few-Shot Learners y en 2022 InstructGPT .
Son máquinas estadísticas, entrenadas con muchos datos (Big Data), donde predicen la siguiente palabra que tiene más probabilidad de salir, según el contexto. Después pueden ajustarse por prompt-tuning, ajuste fino, retroalimentación humana entre otras técnicas. Con el fin de eliminar sesgos, discursos de odio o alucinaciones.
Estos LLMS nos han permitido realizar tareas con las IAS como:
- Conversar
- Responder a preguntas
- Generar textos
- Traducir a diferentes idiomas
- Sintetizar o resumir
- Extraer información
- Transformar a otros tipos de lenguaje (técnico, informal…).
- Corregir gramaticalmente o por estilo.
- Explicar temas
- Preguntar
Todo esto, hecho con prompts en lenguajes natural, como si habláramos con una persona normalmente, o por API (para la integración con otros programas).
Os recomendamos los siguientes productos relacionados con la informática: