Disciplina que se ocupa de desarrollar algoritmos y modelos para dotar a los ordenadores de la capacidad de identificar patrones en grandes volúmenes de datos y elaborar predicciones a partir de ellos, sin estar explícitamente programados para cada tarea.

Descripción

El aprendizaje automático o machine learning es un subcampo de la inteligencia artificial que permite a los sistemas informáticos aprender a partir de los datos sin ser programados explícitamente para cada tarea.

La idea central es que, en lugar de que un programador escriba reglas específicas para cada posible escenario, el sistema utiliza algoritmos para analizar grandes , identificar patrones en ellos y luego aplicar esos patrones para tomar decisiones o hacer predicciones sobre datos nuevos.

El sistema mejora su precisión y desempeño con el tiempo a medida que se le proporcionan más datos para analizar y aprender.

El proceso se puede resumir en los siguientes pasos:

1. Recolección y preparación de datos

Se recopilan y limpian grandes cantidades de datos relevantes para la tarea que el sistema debe aprender a realizar.

2. Entrenamiento del modelo

Los datos se introducen en un algoritmo de machine learning (el «modelo») que los procesa para encontrar las relaciones y patrones subyacentes. Este es el proceso de «aprendizaje».

3. Evaluación

Se prueba el modelo con datos que no ha visto para verificar su precisión y rendimiento.

4. Predicción/aplicación

Una vez entrenado y validado, el modelo se utiliza para analizar nuevos datos y generar resultados o predicciones.

Aplicaciones comunes

El aprendizaje automático es la tecnología detrás de muchas herramientas modernas:

Sistemas de recomendación

Sugerencias de películas en Netflix o productos en Amazon.

Reconocimiento facial y de voz

Asistentes de voz (Siri, Alexa) y desbloqueo de teléfonos.

Detección de fraude

Identificación de transacciones bancarias sospechosas.

Vehículos autónomos

Herramientas que hacen posible que los coches interpreten su entorno.

Tipos

Dentro del aprendizaje automático encontramos variedades como el aprendizaje supervisado, el aprendizaje no supervisado o el aprendizaje por refuerzo.

Aprendizaje supervisado

Una forma de entrenamiento que se desarrolla con base en un conjunto de datos y una etiqueta con la respuesta correcta para cada dato. Se aplica, por ejemplo, para cálculos de y modelos de clasificación.

Aprendizaje no supervisado

Creación de modelos de respuesta por medio de la búsqueda de patrones y relaciones entre conjuntos de datos sin etiquetas.

A diferencia del aprendizaje supervisado, en este caso se recurre a procesos de clustering de datos.

Aprendizaje por refuerzo

Proceso de automatización por medio de un agente que se coloca en un ambiente determinado y que aprende a través de acciones y retroalimentación.

Ejemplos

Este es uno de los usos más comunes y efectivos del machine learning hoy en día.

El problema

El objetivo es construir un sistema que pueda examinar cualquier correo electrónico entrante y clasificarlo automáticamente como «spam» (correo no deseado) o «ham» (correo legítimo), minimizando el riesgo de que correos importantes terminen en la carpeta de spam.

Los datos de entrenamiento

En el aprendizaje supervisado, necesitamos datos etiquetados:

  • Datos: Miles de correos electrónicos.

  • Etiquetas: Cada correo debe estar previamente marcado por humanos (o por la interacción inicial del usuario) como «spam» (clase A) o «ham» (Clase B).

El entrenamiento del modelo

El algoritmo (por ejemplo, un clasificador bayesiano ingenuo o una máquina de vectores de soporte) analiza estos correos etiquetados:

  • Extracción de características (features): El modelo identifica características que son comunes en los correos de spam, como:

    • Frecuencia de palabras sospechosas («gratis», «ganador», «urgente»).

    • Uso de demasiadas mayúsculas y signos de exclamación.

    • Ausencia de una dirección de remitente conocida.

    • Presencia de enlaces acortados o sospechosos.

  • Aprendizaje: El algoritmo calcula la probabilidad de que un correo sea spam, dada la presencia de estas características. Por ejemplo, aprende que un correo que contiene la palabra «viagra» tiene una probabilidad del de ser spam.

La predicción

Una vez entrenado, el modelo está listo para funcionar.

Cuando llega un nuevo correo sin etiquetar:

  1. El modelo extrae las mismas características del nuevo correo.

  2. Utiliza la función de probabilidad que aprendió para calcular la clase más probable.

  3. Si la probabilidad de ser spam supera un umbral (por ejemplo, ), lo clasifica como spam y lo envía a la carpeta de correo no deseado. Si no, lo deja en la bandeja de entrada (ham).

Conclusión

El sistema no fue programado con una regla estricta como «si ves ‘ganador’ y ‘gratis’, es spam». En cambio, el modelo aprendió, basándose en miles de ejemplos, a diferenciar entre los dos tipos de correos de forma autónoma. Y lo que es más importante, mejora continuamente a medida que se le proporcionan nuevos datos.

El objetivo de la segmentación es descubrir grupos o patrones ocultos dentro de un gran conjunto de datos de clientes, sin que se le diga al algoritmo de antemano cuántos grupos existen o qué características definen a cada grupo.

El problema

Una empresa de ecommerce tiene miles de clientes y quiere dirigir sus campañas de marketing de forma más eficiente. Si envía la misma promoción a todos, desperdiciará recursos en clientes que no están interesados. Necesita entender qué tipos de clientes tiene.

Los datos de entrada (sin etiquetas)

En el aprendizaje no supervisado, los datos no tienen etiquetas (no están marcados como «Este es un cliente A» o «Este es un cliente B»).

  • Datos: Un que contiene métricas de comportamiento de cada cliente, como:

    • Monto total gastado.

    • Frecuencia de compra (cuántas veces compran al mes/año).

    • Tipos de productos comprados.

    • Tiempo transcurrido desde la última compra.

El entrenamiento del modelo (clustering)

Se aplica un algoritmo de clustering, siendo K-Means uno de los más populares.

  • Proceso: El algoritmo toma los datos y comienza a agrupar a los clientes basándose en la similitud de sus características.

  • Aprendizaje: El modelo «aprende» que ciertos clientes tienen comportamientos similares. Por ejemplo, los clientes que compran a menudo y gastan poco terminan juntos, mientras que los que compran raramente pero gastan mucho terminan en otro grupo.

El modelo crea las agrupaciones por sí mismo, identificando la estructura que existe en los datos.

Los resultados y la aplicación

El resultado es la formación de distintos segmentos de clientes (clusters), cada uno con un perfil de comportamiento único:

Cluster Descripción de perfil (descubierto por machine Learning) Acción de marketing
Grupo 1 Compradores frecuentes: Alta frecuencia, bajo gasto . Ofrecer suscripciones o programas de fidelización.
Grupo 2 «Ballenas» (alto valor): Baja frecuencia, muy alto gasto promedio. Enviar ofertas de productos premium exclusivos.
Grupo 3 En riesgo de abandono: Baja frecuencia, mucho tiempo desde la última compra. Enviar cupones de reactivación y de satisfacción.

El sistema de aprendizaje automático no fue instruido sobre qué era un «comprador frecuente»; simplemente descubrió ese patrón por sí mismo. La empresa ahora puede utilizar estos conocimientos para personalizar sus mensajes y maximizar las ventas de manera eficiente.

Un ejemplo real y muy visible es el entrenamiento de un agente de IA para jugar juegos complejos, como los programas que han logrado dominar el ajedrez, Go o videojuegos de Atari.

El problema

El objetivo es que el agente aprenda una política óptima, que es el mejor conjunto de acciones a tomar en cualquier estado para maximizar la recompensa total acumulada a largo plazo.

Elementos fundamentales

El aprendizaje por refuerzo se define por cuatro componentes principales:

  • Agente: El aprendiz o el que toma las decisiones (en este caso, un programa de IA).

  • Entorno: El mundo con el que interactúa el agente (por ejemplo, un tablero de ajedrez o una sala).

  • Estado: La situación actual del entorno (por ejemplo, la posición de las piezas en el tablero).

  • Acción: Lo que el agente puede hacer para cambiar el estado (por ejemplo, mover una pieza).

  • Recompensa: Una señal numérica que el entorno da al agente para indicar cuán buena fue la acción (positiva o negativa).

Concepto de aprendizaje por refuerzo Aplicación en un agente que juega a Pong
Agente El programa de IA.
Entorno El juego Pong (la pantalla y la física del juego).
Estado La posición de la pala del agente, la posición y dirección de la pelota.
Acción Mover la pala hacia arriba o hacia abajo.
Recompensa +1 punto si el agente golpea la pelota; -1 punto si falla la pelota (el oponente anota).

El proceso de aprendizaje

  1. El agente comienza sin saber nada.

  2. Toma acciones aleatorias (ensayo y error).

  3. Cuando el agente realiza una acción que lleva a una recompensa positiva (ej., golpea la pelota), el algoritmo refuerza esa acción para el estado correspondiente.

  4. Cuando una acción conduce a una recompensa negativa (ej., falla la pelota), el algoritmo disminuye la probabilidad de repetir esa acción en ese estado.

  5. A través de millones de interacciones, el agente aprende a asociar cada estado con la acción que maximiza su recompensa futura (es decir, aprende la mejor manera de jugar).

Sinónimos:
machine learning
Categorías: TIC