Ce repo contient ma proposition à l'exercice proposé par xebia pour l'entretien de data scientist. Le résultat est dans data/result.
Les différents notebooks sont :
- analysis_phase : Analyse générale du jeu de données pour repérer les variable aberrantes;
- cleaning_phase : Phase de nettoyage des données et de l'étude des variables corrélées;
- modeling : Phase de modélisation et de prédiction.