Prendre un échantillon du fichier contenant les extraits de presse contenant les mots 'rixe' et 'italien'.
Scinder la colonne location en deux :
- location_ville
- location_region
Ajouter des colonnes :
- en_france -> 0 (non) ou 1 (oui)
- xenophobe -> 0 (non) ou 1 (oui)
- participants -> EE (étranger-étranger), EF (étranger-français), FF (français-français), NA (non-applicable)
Annoter manuellement l'échantillon pour les colonnes :
- location_ville
- location_region
- description_of_event
- en_france
- xenophobe
- participants