Analyse par composantes principales

Dans cette section, nous explorons ce qui est peut-être l’un des algorithmes d’apprentissage machine le plus largement utilisés, l’analyse en composantes principales (ACP). L’ACP est fondamentalement un algorithme de réduction de la dimensionnalité, mais elle peut également être utile comme outil de visualisation, de filtrage du bruit, d’extraction et d’ingénierie de caractéristiques (feature engineering), et bien plus encore. Après une brève discussion conceptuelle de l’algorithme PCA, nous verrons quelques exemples de ces autres applications.

Introduction à l’analyse en composantes principales

L’analyse en composantes principales est une méthode rapide de réduction de la dimension des données. Son comportement est plus facile à visualiser en examinant un ensemble de données bidimensionnelles. Considérez les 200 points suivants :