Généralisation des données

live with your data before you plunge into modeling”
— Leo Breiman

Les techniques de préparation et d’ingénierie des données font généralement référence à l’ajout, à la suppression ou à la transformation des données ou des variables. Hélas, cette tâche peut être très fastidieuse et requiert pas mal de temps. Toutefois, il faut se rappeler que le fait de bien comprendre les données nous aide à être plus précis dans l’étape de modélisation [B+01]

Dans cette séance, nous verrons les différentes techniques de généralisation qui nous permettent de comprendre nos données, ainsi que les approches pour atteindre le bon niveau de généralisation des données.

B+01

Leo Breiman and others. Statistical modeling: the two cultures (with comments and a rejoinder by the author). Statistical science, 16(3):201, 2001.