Un modelo de lenguaje basado en una red neuronal artificial con gran cantidad de parámetros, entrenados mediante aprendizaje supervisado o aprendizaje semisupervisado.
Contenidos
mostrar
Descripción
Un LLM (por sus siglas en inglés, Large Language Model o modelo de lenguaje grande) es un tipo de modelo de inteligencia artificial diseñado para entender, generar y manipular lenguaje humano. Estos modelos están entrenados con enormes cantidades de texto para aprender patrones lingüísticos, significados, gramática y contexto.
Características
Tamaño
- Son modelos con miles de millones de parámetros (variables internas que ajustan su comportamiento), lo que les permite capturar relaciones complejas en el lenguaje.
Entrenamiento
- Se entrenan con corpus extensos de texto (como libros, artículos, sitios web) mediante técnicas de aprendizaje profundo.
Capacidades
- Generación de texto coherente y contextual.
- Traducción automática.
- Resumen de documentos.
- Respuesta a preguntas.
- Asistencia en redacción y codificación.
Sinónimos:
modelo de lenguaje grande