Les sites E-commerce font transiter beaucoup d'argent. Cela peut engendrer des risques non négligeables d'activités frauduleuses comme l'utilisation de carte de crédit volées, du blanchiment d'argent etc.
Fort heureusement, le Machine Learning peut nous aider à identifier ces activités frauduleuses. Tous les sites web où vous devez entrer vos informations de paiements ont une équipe qui s'occupe de gérer les risques de fraude via le ML.
Le but de ce challenge est de construire un modèle qui vous permette de prédire une probabilité de transaction frauduleuse.
L'entreprise X fait du E-commerce et vend des vêtements faits-main. Votre but est de construire un modèle qui permette de prédire si l'achat d'un vêtement doit être considérée comme une transaction frauduleuse ou non.
Voici précisément ce que vous devez faire :
-
Pour chacun des utilisateurs, déterminez le pays d'origine depuis son adresse IP
-
Construisez un modèle qui permette de prédire si l'activité est frauduleuse ou non. Expliquez aussi vos choix / hypothèses en termes d'optimisation de faux-positifs et faux-négatifs
-
Votre patron aimerait comprendre votre modèle car elle est inquiète d'utiliser un modèle black box. Comment l'expliqueriez vous d'un point utilisateur, et non pas mathématiques. Par exemples, quels sont les utilisateurs qui peuvent être classés comme risqués ?
-
Disons que vous pouvez utiliser votre modèle en live pour qu'il fasse sa prédiction en temps réel. D'un point de vu Produit, comment vous l'utiliseriez ? Comment pourriez vous pensez l'expérience utilisateur fasse à ce produit ?
Vous avez deux tables que vous pourrez utiliser :
Fraud_Data
&
IpAddress_to_Country