Skip to content

PirehP1/html_to_historical_data

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

22 Commits
 
 
 
 
 
 
 
 

Repository files navigation

html_to_historical_data

Service python en Flask qui récupère tous les liens vers des notices d'autorité IdRef présents dans un fichier HTML ou XML transmis par l'utilisateur afin de produire un tableau de synthèse des données disponibles dans les notices en question. Le tableu de synthèse est créé à partir de requêtes SPARQL adressées au endpoint d'IdRef.

Dans l'état actuel du script (février 2024) les chaînes de caractères à chercher doivent être balisées par un élément <nom> dans lequel un attribut sameAS doit contenir l'URI de la notice d'autorité IdRef correspondante. Par exemple :

<nom type="personne" valeur="Broglie (de), Albert" sameAs="http://www.idref.fr/029795370/id">Broglie</nom>

Il s'agit d'un développement réalisé dans le contexte de l'enseignement de L1 les écritures numériques de l'histoire dispensé à l'Université Paris Panthéon-Sorbonne. L'objectif étant de faire comprendre aux étudiants comment il est possible de récupérer automatiquement des données historiques à partir de l'édition numérique de documents anciens numérisés.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published