Una técnica estadística de reducción de dimensionalidad que transforma un conjunto de variables posiblemente correlacionadas en un conjunto más pequeño de variables no correlacionadas llamadas componentes principales.

Este método es especialmente útil para simplificar datos complejos, identificar patrones ocultos y mejorar la eficiencia de los modelos de machine learning.

Se abrevia PCA por su nombre en inglés.

Objetivos

  • reducción de dimensionalidad (reducir el número de variables manteniendo la mayor parte de la variabilidad original)
  • eliminación de redundancia (remover colinealidad entre variables)
  • descubrimiento de estructuras latentes (identificar relaciones subyacentes en los datos)
  • visualización de datos en espacios reducidos (facilitar la interpretación y análisis exploratorio de datos)
Sinónimos:
principal component analysis