Skip to content
This repository has been archived by the owner on Aug 30, 2021. It is now read-only.

Latest commit

 

History

History
81 lines (66 loc) · 4.07 KB

README.md

File metadata and controls

81 lines (66 loc) · 4.07 KB

GND Dashboard

Das Python Meetup der DNB erstellt anlässlich der GNDcon II ein interaktives Dashboard.

Abhängigkeiten

Erzeugung der Daten

Um die statistischen Auswertungen zu erstellen, wird ein aktueller Abzug der Katalogdaten (in PICA+) benötigt. Diese Datei ist im Projektverzeichnis unter DNBGNDtitel.dat.gz abzulegen.

Die Auswertungen werde wie folgt erzeugt:

$ make -j4 all
$ tree -L 1 stats/
stats/
├── gnd_entity_count.csv
├── gnd_entity_types.csv
├── gnd_relation_count.csv
├── gnd_systematik.csv
├── title_gnd_links.csv
├── title_gnd_links_unique.csv
├── title_gnd_mean.csv
├── title_gnd_mean_Tb.csv
├── title_gnd_mean_Tf.csv
├── title_gnd_mean_Tg.csv
├── title_gnd_mean_Tp.csv
├── title_gnd_mean_Ts.csv
├── title_gnd_mean_Tu.csv
├── title_gnd_top10.csv
├── title_gnd_top10_Tb.csv
├── title_gnd_top10_Tf.csv
├── title_gnd_top10_Tg.csv
├── title_gnd_top10_Tp.csv
├── title_gnd_top10_Ts.csv
└── title_gnd_top10_Tu.csv

0 directories, 20 files

Alle erzeugten Artefakte können mit make clean gelöscht werden.

Auswertungen

Die Auswertung der Verlinkungen der GND zu den DNB-Titeldaten basiert auf den PICA+-Fledern: 022A.9, 028A.9, 028C.9, 029A.9, 029F.9, 032X.9, 033A.9, 033E.9, 033D.9, 033H.9, 039B.9, 039C.9, 039D.9, 039E.9, 039S.9, 039V.9, 039W.9, 039X.9, 039Z.9, 039H.9, 039I.9, 039T.9, 039U.9, 039Y.9, 041A.9, 044G.9 sowie 044P.9. Verknüpfungen aus den Feldern 044H.9 (automatisch vergeben) und 044K.9 gehen nicht mit in die Gesamtmenge ein.

Allgemein

Nach Entitätstyp