Un modelo de lenguaje basado en una red neuronal artificial con gran cantidad de parámetros, entrenados mediante aprendizaje supervisado o aprendizaje semisupervisado.

Descripción

Un LLM (por sus siglas en inglés, Large Language Model o modelo de lenguaje grande) es un tipo de modelo de inteligencia artificial diseñado para entender, generar y manipular lenguaje humano. Estos modelos están entrenados con enormes cantidades de texto para aprender patrones lingüísticos, significados, gramática y contexto.

Características

Tamaño

  • Son modelos con miles de millones de parámetros (variables internas que ajustan su comportamiento), lo que les permite capturar relaciones complejas en el lenguaje.

Entrenamiento

  • Se entrenan con corpus extensos de texto (como libros, artículos, sitios web) mediante técnicas de aprendizaje profundo.

Capacidades

  • Generación de texto coherente y contextual.
  • Traducción automática.
  • Resumen de documentos.
  • Respuesta a preguntas.
  • Asistencia en redacción y codificación.

Ejemplos

  • GPT (de OpenAI, como GPT-4)
  • PaLM (de Google)
  • LLaMA (de Meta)
  • Claude (de Anthropic)
Sinónimos:
modelo de lenguaje grande