Un modelo de lenguaje basado en una red neuronal artificial con gran cantidad de parámetros, entrenados mediante aprendizaje supervisado o aprendizaje semisupervisado.

Descripción

Un LLM (por sus siglas en inglés, Large Language Model o modelo de lenguaje grande) es un tipo de modelo de inteligencia artificial diseñado para entender, generar y manipular lenguaje humano. Estos modelos están entrenados con enormes cantidades de texto para aprender patrones lingüísticos, significados, gramática y contexto.

Características

Tamaño

  • Son modelos con miles de millones de parámetros (variables internas que ajustan su comportamiento), lo que les permite capturar relaciones complejas en el lenguaje.

Entrenamiento

Capacidades

  • Generación de texto coherente y contextual.
  • Traducción automática.
  • Resumen de documentos.
  • Respuesta a preguntas.
  • Asistencia en redacción y codificación.

Ejemplos

Modelo desarrollado por OpenAI, como GPT-4.

Modelo de Lenguaje para Aplicaciones de Diálogo. Modelo de Lenguaje para Aplicaciones de DiálogoUna familia de LLM conversacionales desarrollada por Google.

LLM desarrollado por la empresa Meta.

Modelo desarrollado por Google.

LLM de la empresa Anthropic.

Sinónimos:
modelo de lenguaje grande