large language model

Un modelo de lenguaje basado en una red neuronal artificial con gran cantidad de parámetros, entrenados mediante aprendizaje supervisado o aprendizaje semisupervisado.

Contenidos mostrar

Descripción

Un LLM (por sus siglas en inglés, Large Language Model o modelo de lenguaje grande) es un tipo de modelo de inteligencia artificial diseñado para entender, generar y manipular lenguaje humano. Estos modelos están entrenados con enormes cantidades de texto para aprender patrones lingüísticos, significados, gramática y contexto.

Características

Tamaño

Son modelos con miles de millones de parámetros (variables internas que ajustan su comportamiento), lo que les permite capturar relaciones complejas en el lenguaje.

Entrenamiento

Se entrenan con corpus extensos de texto (como libros, artículos, sitios web) mediante técnicas de aprendizaje profundo.

Capacidades

Generación de texto coherente y contextual.
Traducción automática.
Resumen de documentos.
Respuesta a preguntas.
Asistencia en redacción y codificación.

Ejemplos

GPT

Modelo desarrollado por OpenAI, como GPT-4.

LaMDA (Language Model for Dialogue Applications)

Modelo de Lenguaje para Aplicaciones de Diálogo. Modelo de Lenguaje para Aplicaciones de DiálogoUna familia de LLM conversacionales desarrollada por Google.

LLaMA

LLM desarrollado por la empresa Meta.

PaLM

Modelo desarrollado por Google.

Claude

LLM de la empresa Anthropic.

Sinónimos:

modelo de lenguaje grande