Kunstbibliothek goes Wikidata

von Elin Gleißberg und Melanie Reymer

Abbildung 1: OpenRefine is magic (Quelle: S. Carlson, https://openrefine.org/community)

Was tun, wenn nach der Migration des Bibliothekssytems plötzlich eine große Zahl von lokalen Normdaten für Nutzende zu verschwinden droht? Lokale Normdaten in die freie Wissensbasis übertragen und mit Linked Open Data (LOD) einen Mehrwert schaffen – weltweit sowie für die Mitarbeitenden der Bibliothek – dies war das Ziel des Projekts „Kunstbibliothek goes Wikidata“. Das Projekt setzt die Übertragung lokaler Künstler*innen-Normdaten für die Kunstbibliothek des documenta archivs in Kassel in die freie Wissensbasis um. Diese Normdaten-Sammlung enthält Informationen zu Künstler*innen und -kollektiven, die an documenta-Ausstellungen teilgenommen haben. Neben biografischen Informationen beinhaltet die Sammlung insbesondere Angaben zur künstlerischen Disziplin im Kontext der documenta-Teilnahme. Nach der Migration des Bibliothekssystems sind die Daten im Katalog nicht mehr recherchierbar. Es entstand daher die Idee, die Normdaten der Künstler*innen als Linked Open Data (LOD) in Wikidata zu veröffentlichen und damit für die Kunstbibliothek, ihre Nutzer*innen und andere Interessierte wie z.B. Kunsteinrichtungen zugänglich und nachnutzbar zu machen.

Um die Normdaten der Kunstbibliothek als LOD in Wikidata bereitzustellen, wurde für die Bearbeitung das Open Source-Tool OpenRefine verwendet. Da es sich bei den Personendatensätzen mit über 20.000 Einträgen um eine große Sammlung handelt, wurde das Vorhaben in einem Pilotprojekt mit dem Datensatz der 13. documenta (2012) umgesetzt. Dieser Datensatz umfasst mit 186 Personen und 16 Künstlerkollektiven mehr als 200 Einträge.

Eine stichprobenartige Recherche zeigte, dass für die meisten Künstler*innen bereits Wikidata-Einträge bestanden, sodass die Metadaten des documenta archivs lediglich bestehende Normdaten anreichern. Damit die Daten einen möglichst hohen Nutzwert für Interessierte haben, bestand die Aufgabe darin, den documenta-Bezug herzustellen und gegebenenfalls die Kunstdisziplin der documenta-Teilnehmer*innen abzubilden. Zunächst wurde ein Pretest mit einem Minidatensatz von sechs Personen durchgeführt. Danach konnte das Projekt mit dem vollständigen Datenmaterial von 202 Normdatensätzen gestartet werden.

Abbildung 2: Ausschnitt Datenobjekt dOCUMENTA (13) (Quelle: Wikidata)

Das Datenmaterial wurde mit OpenRefine in vielen Einzelschritten strukturiert, umgewandelt und bereinigt. Nach dieser Datenaufbereitung erfolgte ein Abgleich der Künstler*innen gegen die GND, VIAF und Wikidata. Für den Import der Normdaten in Wikidata wurden verschiedene Schemata erstellt. Nach dem Datenupload ist nun in Wikidata für alle Künstler*innen und – Kollektive ein Statement über die Teilnahme an der dOCUMENTA (13) angelegt sowie die Teilnahme unter dem Eintrag der dOCUMENTA (13) gelistet. Zudem wurden auch Preisträger des Arnold-Bode-Preises verzeichnet, neue Einträge für einzelne Künstler*innen und Gruppen angelegt und eine documenta archiv ID hinzugefügt.

Abbildung 3: Der Weg von lokalen Daten zu Linked Open Data, Prozess-Visualisierung.
(Quelle: E. Gleißberg und M. Reymer, unter Verwendung der Logos von OpenRefine und Wikidata)

OpenRefine bietet die Möglichkeit, die Bearbeitungshistorie im JSON-Format zu extrahieren und die Schemata zu speichern. Diesen Workflow kann die Kunstbibliothek für die Bearbeitung weiterer Künstler*innen-Normdaten nachnutzen. Außerdem wurde eine Konkordanzliste der Wikidata- und ALMA-IDs aus OpenRefine exportiert.

Abbildung 4 : Ausschnitt aus der Export – Liste der Wikidata – IDs (Quelle: E. Gleißberg und M. Reymer)

Es ist geplant, diese Liste in Alma zu importieren, um so eine direkte Verlinkung mit dem Wikidata-Eintrag herzustellen. Zu Dokumentationszwecken wurde in Wikidata eine Projektseite erstellt:

https://www.wikidata.org/wiki/Wikidata:WikiProject_Pilot/documenta_archiv/Artist_files

Für das Projektteam war es eine großartige Erfahrung, mit konkreten Daten eine Nutzanwendung für Wikidata zu testen.

 

Projektzeitraum: April 2023 – August 2023
Projektbetreuerin: Prof. Dr. Inka Tappenbeck
ORCiD:

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert