-
Notifications
You must be signed in to change notification settings - Fork 4
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Ajoute texte méthodo autour des scores.
- Loading branch information
1 parent
1b31d5b
commit dc48045
Showing
2 changed files
with
24 additions
and
5 deletions.
There are no files selected for viewing
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -1,18 +1,39 @@ | ||
Risque élevé : | ||
<!-- DOCTOC SKIP --> | ||
|
||
# Evaluation du modèle Signaux Faibles - mars 2024 | ||
|
||
## Méthodologie | ||
|
||
Cette évaluation porte sur un algorithme d’apprentissage supervisé effectuant un entraînement à partir de données s’étalant de janvier 2016 à février 2024. | ||
|
||
La définition de la cible d’apprentissage nous contraint, pour une évaluation en «_conditions réelles_», c’est-à-dire une prédiction portant sur un ensemble de SIREN pour lesquels des données sont présentes dans le jeu d’apprentissage : | ||
|
||
- à arrêter l’apprentissage 18 mois avant le début du jeu d’évaluation, afin d’éviter toute fuite de données depuis le jeu d’entraînement vers ce jeu d’évaluation ; | ||
- à conserver une connaissance de l’état de procédure collective située 18 mois en aval du jeu de validation choisi. | ||
|
||
Ces deux conditions cumulées ne permettent pour l’instant pas d’évaluer les modèles sur une période post-covid (après le début de l’année 2020) significative. | ||
|
||
La méthode proposée ici permet d’évaluer la robustesse du modèle au cours du temps : l’évaluation porte sur des cas déterminés au hasard sur une période s’étendant de janvier 2016 à août 2022 et contient 5M d’échantillons, chacun associé à un couple (SIREN, mois) unique. | ||
|
||
## Scores | ||
|
||
Les scores associés aux deux catégories de risque définies dans le [document principal](../algorithme-evaluation.md) sont décrits ci-dessous. | ||
|
||
### Seuil « Risque élevé » | ||
|
||
- $F_{0.5}$ : 0.55 | ||
- Précision : 0.62 | ||
- Rappel : 0.37 | ||
- Exactitude pondérée : 0.68 | ||
|
||
Risque modéré : | ||
### Seuil « Risque modéré » | ||
|
||
- $F2$ : 0.58 | ||
- Précision : 0.36 | ||
- Rappel : 0.69 | ||
- Exactitude pondérée : 0.82 | ||
|
||
Métriques globales : | ||
### Métriques globales | ||
|
||
- Aire sous la courbe ROC : 0.93 | ||
- Précision moyenne : 0.51 |