Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

focus : cas de divergences codes fantoir #151

Closed
Tracked by #9
mmortier opened this issue Apr 28, 2023 · 4 comments · Fixed by BaseAdresseNationale/fantoir#32 or #258
Closed
Tracked by #9

focus : cas de divergences codes fantoir #151

mmortier opened this issue Apr 28, 2023 · 4 comments · Fixed by BaseAdresseNationale/fantoir#32 or #258
Assignees
Labels

Comments

@mmortier
Copy link
Contributor

nouveaux cas à investiguer pour des divergences et des codes annulés sur les départements 57 et 80. cf fichiers en PJ.
BANV2.IGN.UR80.RIVDIFF.xlsx
BANV2.IGN.UR57.RIVDIFF.xlsx

@mmortier
Copy link
Contributor Author

mmortier commented Jun 5, 2023

Fichiers livrés pour analyse à la DGFIP, en attente des retours

@mmortier mmortier moved this from Bloqué to En cours in Base Adresse Nationale Jun 28, 2023
@mmortier
Copy link
Contributor Author

Nouvelle rencontre pour parler des résultats obtenus suite à modification code de Fantoir le 29 juin

@mmortier mmortier moved this from En cours to Bloqué in Base Adresse Nationale Jul 4, 2023
@mmortier
Copy link
Contributor Author

mmortier commented Jul 4, 2023

4 pistes d'améliorations testées :

  • ajout d'un poids sur une comparaison du nom majuscule BAN et DGFIP complet au best result, ce qui permet de mieux discriminer la voie référée en cas de mots directeurs communs sur plusieurs candidats.
  • si plusieurs candidats possibles et que le meilleur candidat est une voie annulée sans successeur, on prend un autre candidat.
  • si on a au final un best result qui est une voie annulée sans successeur, on demande le calcul d'un pseudo code plutôt que d'avoir une voie annulée.
  • On nettoie le nom de la voie en enlevant tout ce qu'il y a au delà d'une parenthèse ouvrante.

Relivraison du fichier du 49 pour avoir des statistiques d'analyse de la DGFIP.
En attente de retour pour voir si on déploie la correction.

@mmortier mmortier moved this from Bloqué to En cours in Base Adresse Nationale Sep 5, 2023
@mmortier
Copy link
Contributor Author

mmortier commented Sep 6, 2023

Avec les 4 corrections, l'analyse sur le 49 permet d'améliorer les taux de correspondances de fantoir trouvés entre la BAN et la DGFIP de 58% à 63%.
Les discordances (codes différents trouvés) passent de 724 voies à 140 voies.

La plus grosse marge de progression se situe sur des cas où le code fantoir est trouvé par l'algorithme MAJIC mais pas par la BAN. Des exemples devraient être fournis pour étudier ces cas en particuliers.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment