Skip to content

BIMM99/MyWiki

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

MyWiki

Ce dépôt contient divers fichiers permettant de valoriser les dumps de Wikipédia disponibles à ce lien.

Possibilités

Il y a des fonctions permettant

  • de récupérer tous les titres d'articles d'un fichier .xml
  • de transformer le .xml en une base Sqlite
  • d'afficher le tout avec un interface tkinter simple

Contenu

  • un notebook MyWiki.ipynb contenant un guide pour créer sa propre GUI affichant les contenus textes de wikipédia (utilisation du galicien dans notre cas mais cela peut-être changé)
  • un dossier src avec un script bash pour récupérer les dumps et les transformer en fichier texte
  • dossier docs contenant le rapport rendu en cours (format .pdf et .qmd), on y trouve des informations sur l'infrastructure Wikipédia et une présentation sur la mise en pratique.
  • les dossiers output_csv, dumps, DB et text qui sont vides mais sont nécessaires pour l'arborescence, ils doivent recevoir les dumps téléchargés depuis le site de Wikipédia, les outputs en csv et les textes (de WikiExtractor)
  • le dossier img avec des images de la GUI et des images utilisées dans le rapport de docs pour le rendu du .qmd
  • ce README.md présentant succintement le rapport

Requirements

  • Python 3.9+ avec pandas, tkinteret sqlite3installés
  • Bash (système Unix) avec curl installé
  • Wikipedia.Extractor (installable via pip)

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published