Descripción

El término nació en los laboratorios de biología y psicología y, por un proceso de biomímesis -intentando imitar la forma en que el cerebro humano procesa los datos- pasó a la informática moderna y el mundo de la inteligencia artificial. Así como las neuronas biológicas reciben señales químicas para disparar un impulso eléctrico, las redes neuronales artificiales reciben datos de entrada, los procesan y generan una salida. 

Es vital entender que, aunque la IA se inspira en el cerebro, no funciona exactamente igual. La IA es una simplificación matemática extrema.

Biología y neurociencia

Una red neuronal biológica es el conjunto real de neuronas interconectadas que forman el sistema nervioso de los seres vivos. Su función es transmitir impulsos electroquímicos para procesar sensaciones, pensamientos y movimientos.

Mientras que una red de IA puede tener millones de conexiones, el cerebro humano tiene aproximadamente sinapsis (conexiones).

Psicología y ciencias cognitivas

En este campo el concepto de red neuronal se utiliza para estudiar el aprendizaje y la memoria, explicando cómo el cerebro crea asociaciones.

La plasticidad neuronal es el concepto de que nuestras «redes» físicas cambian y se fortalecen cada vez que aprendemos algo nuevo o practicamos una habilidad. La teoría de Hebb lo sintetiza en la famosa frase: «Las neuronas que se disparan juntas, se conectan entre sí».

Las redes neuronales artificiales y la IA

Las redes neuronales artificiales (RNA) son el motor que impulsa el deep learning, una rama avanzada de la inteligencia artificial.

Una RNA se organiza en capas que filtran y transforman los datos:

  1. Capa de entrada: Recibe la información inicial (por ejemplo, los píxeles de una imagen).

  2. Capas ocultas: Los nodos aplican pesos matemáticos a los datos para identificar patrones.

  3. Capa de salida: Proporciona el resultado final (por ejemplo:  «Esta imagen es un gato»).

A diferencia de los algoritmos tradicionales, que se bloquean ante la ambigüedad, las RNA destacan en:

  • Reconocimiento de patrones: Identificar rostros, voces o huellas dactilares.

  • Procesamiento de lenguaje natural (PLN): Es lo que permite a herramientas como ChatGPT entender el contexto de una frase.

  • Predicciones complejas: Desde el mercado bursátil hasta el diagnóstico médico mediante radiografías.

El factor clave: el entrenamiento

Lo que hace «inteligente» a una red neuronal no es su estructura estática, sino su capacidad de ajuste. Mediante un proceso llamado retropropagación (backpropagation), la red compara su resultado con el resultado correcto, detecta el error y ajusta sus conexiones internas para fallar menos la próxima vez.

Redes neuronales convolucionales

Las redes neuronales convolucionales (CNN) son la tecnología que permite a un coche autónomo distinguir a un peatón de un poste de luz o que mi smartphone etiquete mis fotos automáticamente.

A diferencia de una red neuronal estándar, la CNN está diseñada para imitar la corteza visual humana. Su arquitectura procesa la información en niveles de complejidad creciente.

El proceso de convolución

La red descompone una imagen (que para el ordenador no es más que una cuadrícula de números) mediante un proceso llamado convolución, que sigue varios pasos sucesivos.

  1. Detección de características simples: Las primeras capas actúan como filtros que buscan líneas, ángulos y bordes.

  2. Construcción de patrones: Las capas intermedias combinan esos bordes para identificar formas: círculos (ojos), cuadrados (ventanas) o texturas (pelaje).

  3. Identificación de objetos: Las capas finales interpretan el conjunto de formas y determinan, con un alto grado de confianza, qué objeto hay en la imagen.

Antes de las CNN, los programadores tenían que definir manualmente qué características buscar en una imagen (ej. «busca dos círculos para los ojos»). Con las redes neuronales:

  • La red aprende sola: Ella decide qué rasgos son los más importantes para identificar a un perro frente a un gato.

  • Invariancia espacial: Pueden reconocer un objeto sin importar en qué parte de la foto se encuentre o si está ligeramente inclinado.

Ejemplos

Aplicaciones de IA

FaceID y reconocimiento de rostros

Para que un smartphone identifique una cara, no se le dan reglas fijas (como «busca dos ojos»). En su lugar, se utiliza una red neuronal convolucional (CNN), un tipo específico de red diseñada para procesar datos visuales.

Funcionamiento

La red procesa la imagen a través de varias capas jerárquicas:

  1. Capas iniciales (bordes): Detecta líneas simples, contrastes de luz y sombras.

  2. Capas intermedias (formas): Combina esas líneas para identificar estructuras como la curva de una nariz, el contorno de una oreja o la forma de una ceja.

  3. Capas profundas (rasgos complejos): Reconoce patrones específicos que hacen que mi cara sea única, incluso si cambio de peinado o llevo gafas.

  4. Capa de salida: Compara esos rasgos con una base de datos y genera una probabilidad. Si la coincidencia es superior al 95%, el teléfono se desbloquea.

Las RNA ya se utilizan para analizar radiografías y detectar tumores con una precisión que a veces puede superar la de los radiólogos humanos.

Netflix o Spotify usan redes neuronales para analizar nuestros hábitos y predecir qué película o canción nos gustará a continuación (basándose en millones de perfiles similares al nuestro).

Herramientas como DeepL o el traductor de Google utilizan redes neuronales recurrentes para entender el contexto de una frase completa en lugar de traducir palabra por palabra.

Recursos en línea

Sinónimos:
neural network
Categorías: Tecnología