Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Insee Contact data #16

Open
6 tasks
tomseimandi opened this issue Jun 13, 2024 · 0 comments
Open
6 tasks

Insee Contact data #16

tomseimandi opened this issue Jun 13, 2024 · 0 comments
Assignees

Comments

@tomseimandi
Copy link
Collaborator

tomseimandi commented Jun 13, 2024

Anonymize raw Insee Contact data.

"Beaucoup de questions contiennent des informations identifiantes sur les personnes (noms, emails, adresses, etc.)".

Descriptions des échanges :

  • Les mails des usagers sont contenus dans la variable « Exchange1 » ;
  • La réponse d’Insee Contact dans la variable « Exchange2 » ;
  • Le retour de l’usager dans « Exchange3 » le cas échéant, et ainsi de suite.

A faire :

  • Jeu d'évaluation de 200 échanges, fixé
  • Appliquer NER(s ?) adapté(s ?) pour identifier noms, emails, adresses, etc.
  • Anonymiser en retirant les informations personnelles
  • Evaluer taux d'anonymisation automatique sur le jeu d'évaluation
  • Envoyer les résultats au pôle Insee Contact
  • Tout anonymiser et stocker les nouveaux échanges sur MinIO
@tomseimandi tomseimandi self-assigned this Jun 13, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant