Apprentissage statistique¶
L’apprentissage statistique fait référence à un vaste ensemble d’outils permettant de comprendre les données. Ces outils peuvent être classés comme étant supervisés ou non-supervisés.
Nous savons que la modélisation statistique conçoit une relation entre les variables à l’aide d’une équation mathématique. L’apprentissage statistique est un autre type de modélisation, il est basé sur des algorithmes capables d’apprendre à partir des données, sans structure explicite entre les variables. Cela permet au modélisateur d’inférer de nombreuses relations complexes et non linéaires. Mais soyons très clairs, lorsque nous disons “l’algorithme peut apprendre à partir des données”, en aucun cas nous prétendons que nous concevons des modèles “intelligents” au sens de l’intelligence humaine. À vrai dire, le terme “apprendre”, c’est seulement une reconnaissance d’une situation similaire, donc reconnaître que la dernière fois que nous étions dans une telle situation (même sorte de données), nous avons essayé une action particulière (produis ce résultat) et cela a fonctionné (était correct ou très semblable), donc nous allons essayer à nouveau. Là où ça n’a pas marché (résultats obtenus très différents ou taux d’erreur inacceptable), nous allons essayer autre chose