Ce répertoire contient les instruction et les corrections pour les différentes sessions de l'atelier "Python pour les données de la recherche en histoire" du master TNAH - École nationale des chartes.
[!WARNING] Awaiting for a release !
🎯 Objectif : Implémentation d'une interface en ligne de commande (CLI) pour coupler deux fichiers de données au format CSV.
📜 Corpus d'expérimentation : Les annuaires du commerce de Paris, XIXe siècle, extraits par le projet de recherche SoDUCo
🎯 Objectif : Expérimenter la bibliothèque Pandas pour manipuler efficacement de grandes tables de données, et les bibliothèques Dash et Matplotlib pour construire des visualisations dynamiques.
📜 Corpus d'expérimentation : Les inventaires de photographies aériennes anciennes collectées dans le cadre du projet de recherche Alegoria.
📂 session_3/
: Entraîner un modèle de reconnaissance automatique d’entités nommées (REN) dans des textes historiques avec SpaCy
🎯 Objectif : Se familiariser avec l'une des taches classiques du traitement automatique du langage naturelle dans le contexte des données historiques. Apprendre à spécialiser et évaluer une modèle de langage de type BERT à l'aide de la bibliothèque logicielle SpaCy pour extraire les individus et les lieux dans un corpus textuel historique.
📜 Corpus d'expérimentation : Un corpus d'actes notariés transcrits, sur les carrières à plâtre de Belleville et leurs acteurs, XIVe-XVIIIe siècles.