Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Vorschlag für Zotero (halb- und vollautomatisch): kein Indikator für Feld 5520 #2091

Open
IxKo opened this issue Mar 22, 2024 · 17 comments
Open
Labels
Einspielung_Zotero_AUTO Zotero_SEMI-AUTO Problems related to the semi-automatic harvesting process

Comments

@IxKo
Copy link
Contributor

IxKo commented Mar 22, 2024

Problembeschreibung

Bisher werden Keywords in das Feld 5520 mit Indikator |s| für Sach-Schlagwort importiert.

Der Indikator ist laut Dokumentationshilfe fakultativ.

Warum hat man sich bei den Zotero-Verfahren dazu entschieden, immer den Indikator |s| mitzugeben?

Es handelt sich bei den freien Schlagwörtern, die über die Zotero-Verfahren aus den Metadaten mitkommen, nicht ausschließlich um Sachschlagwörter. Es sind bspw. auch viele Geografika- oder Personen-Schlagwörter enthalten.

Ist es dann nicht besser, auf die Auslieferung des Indikators zu verzichten, wenn er nicht verpflichtend ist?

@IxKo IxKo added Zotero_SEMI-AUTO Problems related to the semi-automatic harvesting process Einspielung_Zotero_AUTO labels Mar 22, 2024
@IxTheoKm
Copy link
Contributor

Nach meiner Erinnerung war ursprünglich mal ein Indikator obligatorisch. Das hat sich irgendwann geändert.
Was auf jeden Fall m.E. beibehalten werden sollte, ist der Indikator |f|, der für bestimmte Formschlagwörter definiert ist, damit die Facette "Genre" richtig bedient wird.
Die Facetten "Region..." und "Zeit..." werden ohnehin nicht richtig mit Keywords bedient, die (fälschlich) den Indikator |s| haben. Insofern finde ich den Vorschlag gut.

@jriedl
Copy link

jriedl commented Mar 25, 2024

Warum hat man sich bei den Zotero-Verfahren dazu entschieden, immer den Indikator |s| mitzugeben?

Wir geben keinen Indikator mit, sondern liefern die Schlagwörter in MARC 650 (Ausnahme Rezension in 655). Das scheint aber auch direkt so übernommen/ausgespielt zu werden, vgl. z.B. https://ixtheo.de/Record/1883974208#details. Falls es in WinIBW als Sachschlagwort ausgezeichnet wird liegt es vermutlich an der Lieferung in 650. Wenn man das ändern will, müsste man die 6XX-Felder "korrekt" belegen, das hieße aber eine inhaltliche Analyse der verwendeten Schlagwörter, das scheint ein eigenständiges Projekt.

Die Facetten "Region..." und "Zeit..." werden ohnehin nicht richtig mit Keywords bedient, die (fälschlich) den Indikator |s| haben. Insofern finde ich den Vorschlag gut.

Hinsichtlich der Facetten ist zu überlegen, dass |s| für die Facette "Thema Schlagwort" (in 689) ausgewertet wird. Ansonsten fließen natürlich die 650-Felder ein (da Sachschlagwörter).

@IxKo
Copy link
Contributor Author

IxKo commented Mar 26, 2024

Wir geben keinen Indikator mit, sondern liefern die Schlagwörter in MARC 650 (Ausnahme Rezension in 655). Das scheint aber auch direkt so übernommen/ausgespielt zu werden, vgl. z.B. https://ixtheo.de/Record/1883974208#details. Falls es in WinIBW als Sachschlagwort ausgezeichnet wird liegt es vermutlich an der Lieferung in 650. Wenn man das ändern will, müsste man die 6XX-Felder "korrekt" belegen, das hieße aber eine inhaltliche Analyse der verwendeten Schlagwörter, das scheint ein eigenständiges Projekt.

Es scheint leider laut der K10plus-Formatdokumentation keinen Unterschied beim MARC-Format zu geben zwischen 650 |s| und 650 ohne |...|
Hingegen gibt es gesonderte MARC-Felder für bspw. |p| 600 und für |g| 651
Demnach müsste es mit dem BSZ bzgl. des Konverters geklärt werden, sofern wir uns dazu entscheiden.

Es scheint nach Absprache mit dem BSZ auch möglich zu sein, diese Schlagwörter als "freie Schlagwörter" mit Code [FS] zu kennzeichnen. Ich bin mir nicht sicher, ob das bei den Keywords aus den Metadaten immer zutreffend ist und ob eine explizite Kennzeichnung als freie Schlagwörter sinnvoll ist.
Da es eher ein Thema der SE ist, und es womöglich Einfluss auf die VuFind-Facetten hat, sollten das andere Personen entscheiden.

Mir ging es nur darum, dass im Grunde alles mit Sachbegriff gekennzeichnet wird, obwohl es in einigen Fällen nicht zutreffend ist.
Es ist jedoch nicht möglich, maschinell bspw. Personen oder Geografika zu erkennen und entsprechend zu kennzeichnen. Weshalb ich gar keine Kennzeichnung besser fände, als in einigen Fällen eine falsche.
Für Form-Schlagwörter gibt es diese Enhancement-Map, soweit ich weiß.

@jriedl
Copy link

jriedl commented Mar 26, 2024

Weshalb ich gar keine Kennzeichnung besser fände, als in einigen Fällen eine falsche.

Ich würde immer noch vermuten, dass es einfach nur daran liegt, dass wir die Schlagwörter in 650 liefern und diese deshalb zu Sachschlagwörtern werden (vgl. https://wiki.k10plus.de/display/K10PLUS/MARC21-Exportformat?preview=/27361336/669843476/Pica_Marc_Titeldaten_K10plus_20240129_Wiki.xlsx). Entscheidend für uns im Fall von [FS] wäre, in welchem MARC-Feld die Daten wieder ausgeliefert werden, denn anhand dessen entscheidet sich die Zuordung zu Facetten.
Es müsste also ein Schlagwortfeld gefunden werden, das "bedeutungsneutral" ist. Mir wäre ein solches nicht bekannt, wegen der Facettenzuordnung würde das ohnehin zu Problemen führen. Einzig "saubere" Lösung scheint, die Schlagwörter von vornherein in den "richtigen" Feldern abzulegen (s.u.) oder im Nachgang manuell zu bereinigen.

Es ist jedoch nicht möglich, maschinell bspw. Personen oder Geografika zu erkennen und entsprechend zu kennzeichnen.

Theoretisch könnten sich da zukünftig Möglichkeiten ergeben, aber das ist noch nicht spruchreif und vor allem nicht "einfach so" zu machen.

@IxTheoKm
Copy link
Contributor

oder im Nachgang manuell zu bereinigen.

Das fällt definitiv aus, da es Massen sind!

@IxKo
Copy link
Contributor Author

IxKo commented Mar 27, 2024

Es gebe noch den Schlagwort-Indikator |u| für unbekannt:
<datafield tag="653" ind1=" " ind2=" "><subfield code="a">unbekannt</subfield></datafield>

Es ist jedoch nicht möglich, maschinell bspw. Personen oder Geografika zu erkennen und entsprechend zu kennzeichnen.

Theoretisch könnten sich da zukünftig Möglichkeiten ergeben, aber das ist noch nicht spruchreif und vor allem nicht "einfach so" zu machen.

Hier hätte ich mich vielleicht etwas klarer ausdrücken sollen und "nicht einfach möglich" schreiben sollen. Mit einer Mapping-Liste, in der wir manuell aufgetretene und aufgefallene Fälle eintragen, wäre es auf jeden Fall nicht getan.

Vielen Dank für die Beteiligung aller bisherigen Personen.
Es ist ein Vorschlag gewesen. Ob und in welchem Endprodukt dieser umgesetzt werden sollte, müssen andere entscheiden. Und erst dann müsste überlegt werden, wie die Umsetzung genau erfolgt.

socheres added a commit to ubtue/zotkat-translators that referenced this issue Mar 27, 2024
@socheres
Copy link

Indikator wird in Zotkat nicht mehr hinzugefügt. Für Zotaut bitte BSZ kontaktieren und den Defaultkonverter anpassen lassen. Indikator soll beim Laden in K10+ nicht automatisch hinzugefügt werden. Ausgangsdatei "650 _4 $a", Umsetzung > ohne Indikator "5520 ..."

@jriedl
Copy link

jriedl commented Mar 27, 2024

Indikator wird in Zotkat nicht mehr hinzugefügt. Für Zotaut bitte BSZ kontaktieren und den Defaultkonverter anpassen lassen. Indikator soll beim Laden in K10+ nicht automatisch hinzugefügt werden. Ausgangsdatei "650 _4 $a", Umsetzung > ohne Indikator "5520 ..."

Leider ist mir der Sinn dieses Vorgehens nicht ganz nachvollziehbar - inwiefern werden damit die oben erläuterten und diskutierten Aspekte gelöst - entscheidend ist doch, was am Ende durch das BSZ wieder ausgespielt wird.

@socheres
Copy link

Zotaut-Metadaten Konvertierung

1 Wie liefern wir ans BSZ? (Defaultlieferweg) 2 Wie wird in Pica umgesetzt? (Basis-/Default-Konverter) 3 Wie wird ausgeliefert? (Standard-Konkordanz “Pica_Marc_Titeldaten_K10plus”) 4 Wie wird in IxTheo angezeigt? (SOLR-Indexierung)
<datafield tag="650" ind1=" " ind2="4"><subfield code="a">Metamorphosis</subfield></datafield> 5520 |s|Metamorphosis <datafield tag="650" ind1=" " ind2="4"><subfield code="a">Metamorphosis</subfield></datafield> In der Facette “Thema(Schlagwort)”

@socheres
Copy link

@jriedl 5520 Feld in WiniBW ohne Indikator wird genauso ausgeliefert wie mit Indikator

Pica3 MARC-Ansicht
5520 |s|Bernard Charbonneau 650 4$aBernard Charbonneau
5520 |s|Jacques Ellul 650 4$aJacques Ellul
5520 |s|communion spirituelle 650 4$acommunion spirituelle
5520 |s|éco-spiritualité 650 4$aéco-spiritualité
5520 écologie politique 650 4$aécologie politique

@IxKo
Copy link
Contributor Author

IxKo commented Mar 28, 2024

Indikator wird in Zotkat nicht mehr hinzugefügt.

Ich kann bestätigen, dass beim Export im halbautomatischen Zotero-Verfahren nun kein Sachschlagwort-Indikator |s| exportiert wird.

@socheres
Copy link

Leider ist mir der Sinn dieses Vorgehens nicht ganz nachvollziehbar - inwiefern werden damit die oben erläuterten und diskutierten Aspekte gelöst - entscheidend ist doch, was am Ende durch das BSZ wieder ausgespielt wird.

Mein Vorschlag löst nicht das grundlegende Problem der vers. SW-Gattungen. Würde man nur mit normiertem GND-Vokabular in der Facette(Schlagwort) arbeiten und alles andere als Keywords(=Freie Schlagwörter) in eine eigene Facette verschieben, wäre eine solche Unterscheidung (Person, Werk, Körperschaft, Geographica, teilweise auch Form- und Zeitschlagwort) möglich. Dies wurde aber seinerseits anders entschieden.

@IxKo
Copy link
Contributor Author

IxKo commented Apr 10, 2024

Indikator wird in Zotkat nicht mehr hinzugefügt. Für Zotaut bitte BSZ kontaktieren und den Defaultkonverter anpassen lassen. Indikator soll beim Laden in K10+ nicht automatisch hinzugefügt werden. Ausgangsdatei "650 _4 $a", Umsetzung > ohne Indikator "5520 ..."

Es gibt noch einen kleinen Nebeneffekt bzgl. dem Tag "RezensionstagPica":
Beim Export wird zwar wie gewünscht 1131 !Rezension! erzeugt, aber in 5520 wird RezensionstagPica exportiert.
Kann das noch behoben werden?

@socheres
Copy link

@IxKo Bei mir wird 5520 RezensionstagPica nicht exportiert. Haben Sie Beispiele?

@IxKo
Copy link
Contributor Author

IxKo commented Apr 26, 2024

https://brill.com/view/journals/jecs/75/1-2/article-p121_4.xml?ebody=full%20html-copy1
Beim Import wird unter Tags "RezensionstagPica" importiert. (Wir vergeben dies auch manuell, wenn der Import-Translator die Rezensionen nicht automatisch kennzeichnet.)

Beim Export wird dann korrekt 1131 !106186019! (Rezension) erzeugt, aber auch 5520 RezensionstagPica:
image

@socheres
Copy link

Habe den Translator angepasst. Bitte testen!

@IxKo
Copy link
Contributor Author

IxKo commented Apr 26, 2024

Vielen Dank, es passt nun!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Einspielung_Zotero_AUTO Zotero_SEMI-AUTO Problems related to the semi-automatic harvesting process
Projects
None yet
Development

No branches or pull requests

4 participants