Disciplina que se ocupa de desarrollar algoritmos y modelos para dotar a los ordenadores de la capacidad de identificar patrones en grandes volúmenes de datos y elaborar predicciones a partir de ellos, sin estar explícitamente programados para cada tarea.
Descripción
El aprendizaje automático o machine learning es un subcampo de la inteligencia artificial que permite a los sistemas informáticos aprender a partir de los datos sin ser programados explícitamente para cada tarea.
La idea central es que, en lugar de que un programador escriba reglas específicas para cada posible escenario, el sistema utiliza algoritmos para analizar grandes conjuntos de datos, identificar patrones en ellos y luego aplicar esos patrones para tomar decisiones o hacer predicciones sobre datos nuevos.
El sistema mejora su precisión y desempeño con el tiempo a medida que se le proporcionan más datos para analizar y aprender.
El proceso se puede resumir en los siguientes pasos:
1. Recolección y preparación de datos
Se recopilan y limpian grandes cantidades de datos relevantes para la tarea que el sistema debe aprender a realizar.
2. Entrenamiento del modelo
Los datos se introducen en un algoritmo de machine learning (el «modelo») que los procesa para encontrar las relaciones y patrones subyacentes. Este es el proceso de «aprendizaje».
3. Evaluación
Se prueba el modelo con datos que no ha visto para verificar su precisión y rendimiento.
4. Predicción/aplicación
Una vez entrenado y validado, el modelo se utiliza para analizar nuevos datos y generar resultados o predicciones.
Aplicaciones comunes
El aprendizaje automático es la tecnología detrás de muchas herramientas modernas:
Sistemas de recomendación
Sugerencias de películas en Netflix o productos en Amazon.
Reconocimiento facial y de voz
Asistentes de voz (Siri, Alexa) y desbloqueo de teléfonos.
Detección de fraude
Identificación de transacciones bancarias sospechosas.
Vehículos autónomos
Herramientas que hacen posible que los coches interpreten su entorno.
Tipos
Dentro del aprendizaje automático encontramos variedades como el aprendizaje supervisado, el aprendizaje no supervisado o el aprendizaje por refuerzo.
Aprendizaje supervisado
Una forma de entrenamiento que se desarrolla con base en un conjunto de datos y una etiqueta con la respuesta correcta para cada dato. Se aplica, por ejemplo, para cálculos de regresión estadística y modelos de clasificación.
Aprendizaje no supervisado
Creación de modelos de respuesta por medio de la búsqueda de patrones y relaciones entre conjuntos de datos sin etiquetas.
A diferencia del aprendizaje supervisado, en este caso se recurre a procesos de clustering de datos.
Aprendizaje por refuerzo
Proceso de automatización por medio de un agente que se coloca en un ambiente determinado y que aprende a través de acciones y retroalimentación.