{"id":1090,"date":"2021-05-17T09:54:25","date_gmt":"2021-05-17T09:54:25","guid":{"rendered":"http:\/\/malisprojekte.web.th-koeln.de\/wordpress\/?p=1090"},"modified":"2021-05-17T09:57:44","modified_gmt":"2021-05-17T09:57:44","slug":"umwandlung-von-metadaten-mit-catmandu","status":"publish","type":"post","link":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/umwandlung-von-metadaten-mit-catmandu\/","title":{"rendered":"Umwandlung von Metadaten mit Catmandu"},"content":{"rendered":"<p><strong>von Tim Friedrich<\/strong><\/p>\n<figure id=\"attachment_1091\" aria-describedby=\"caption-attachment-1091\" style=\"width: 801px\" class=\"wp-caption alignnone\"><a href=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/librecat-catmandu.png\"><img loading=\"lazy\" decoding=\"async\" class=\" wp-image-1091\" src=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/librecat-catmandu-300x109.png\" alt=\"\" width=\"801\" height=\"291\" srcset=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/librecat-catmandu-300x109.png 300w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/librecat-catmandu-768x279.png 768w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/librecat-catmandu-619x225.png 619w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/librecat-catmandu.png 890w\" sizes=\"auto, (max-width: 801px) 100vw, 801px\" \/><\/a><figcaption id=\"caption-attachment-1091\" class=\"wp-caption-text\">LibreCat &amp; Catmandu (Quelle: LibreCat)<\/figcaption><\/figure>\n<p style=\"text-align: justify;\">F\u00fcr Bibliotheken ist MARC ein weitverbreitetes Austauschformat. Wie kann man bibliographische Daten in dieses Format umwandeln? In diesem Projekt wurde dies exemplarisch mit dem Tool Catmandu und den Daten des Fernleihindex des hbz durchgef\u00fchrt.<\/p>\n<p><!--more--><\/p>\n<p style=\"text-align: justify;\">Das Ziel war es, die wichtigsten Metadatenfelder aus dem hbz-FIX (Fernleihindex des hbz) zu MARC zu mappen, damit diese perspektivisch in den GVI (Gemeinsamer Verb\u00fcnde-Index) eingespielt werden k\u00f6nnen. Der GVI ist ein Gemeinschaftsprojekt aller Bibliotheksverb\u00fcnde und enth\u00e4lt die Daten dieser und der DNB sowie der ZDB. Der hbz-FIX enth\u00e4lt die Daten von \u00d6ffentlichen, Hochschul- und Spezialbibliotheken, welche f\u00fcr eine Einspielung zu MARC umgewandelt werden sollen. Das Projekt lief von M\u00e4rz bis Juli 2020 und die Projektbetreuerin war Petra Maier (MALIS).<\/p>\n<p style=\"text-align: justify;\">Catmandu ist ein flexibles Tool, um Metadaten zu bearbeiten. Es ist Open Source und funktioniert auf Kommandozeilenbasis. Um Catmandu zu benutzen, wurde eine virtuelle Maschine (VirtualBox von Oracle) mit dem Linux-Betriebssystem Ubuntu eingerichtet. Zur Erkl\u00e4rung der Funktionsweisen von Catmandu gibt es einige Materialien wie eine Anleitung, die Dokumentation auf GitHub und verschiedene \u201eCheat Sheets\u201c, die alle n\u00f6tigen Befehle in K\u00fcrze enthalten.<\/p>\n<figure id=\"attachment_1093\" aria-describedby=\"caption-attachment-1093\" style=\"width: 700px\" class=\"wp-caption alignnone\"><a href=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/virtbox.png\"><img loading=\"lazy\" decoding=\"async\" class=\" wp-image-1093\" src=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/virtbox-300x204.png\" alt=\"\" width=\"700\" height=\"476\" srcset=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/virtbox-300x204.png 300w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/virtbox-768x521.png 768w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/virtbox-619x420.png 619w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/virtbox.png 995w\" sizes=\"auto, (max-width: 700px) 100vw, 700px\" \/><\/a><figcaption id=\"caption-attachment-1093\" class=\"wp-caption-text\">Kommandozeilenfenster in der virtuellen Maschine (Quelle: Tim Friedrich)<\/figcaption><\/figure>\n<p style=\"text-align: justify;\">Catmandu enth\u00e4lt einen einfach zu bedienenden Konverter, mit dem sich Metadaten von einem Format in ein anderes umwandeln lassen (z.B. MAB in MARC). Die Daten des hbz-FIX liegen allerdings in einem eigenen Standard im JSON-Format vor. Die L\u00f6sung hierf\u00fcr ist die sogenannte fix-language in Catmandu. Mit dieser lassen sich mit einfachen Befehlen Daten \u00fcber Pfadangaben manipulieren. So sieht z.B. ein Befehl aus, um die Daten des Titelfelds zu bef\u00fcllen:<\/p>\n<p style=\"text-align: justify;\"><em>\u00a0 \u00a0 \u00a0 \u00a0marc_add(&#8222;245&#8220;, a, $.title, b, $.titelzusatz, c, $.verantwortlichkeit);<\/em><\/p>\n<p style=\"text-align: justify;\">Aufgerufen wird dies \u00fcber die Kommandozeile mit dem Befehl:<\/p>\n<p style=\"text-align: justify;\"><em>\u00a0 \u00a0 \u00a0 \u00a0$ catmandu convert [ein Format] [ein anderes Format] &#8211;fix\u201c[fix-Datei]\u201c &lt; [Ausgangsdatei]<br \/>\n<\/em><\/p>\n<p style=\"text-align: justify;\">Es wurden zwei fix-Dateien angelegt: eine Datei zur Extraktion der Daten (index.fix) und eine zur Umwandlung dieser in MARC (marc.fix). Dies erleichtert einerseits die Fehlersuche und macht andererseits in Zukunft weitere Formate wie MAB oder Dublin Core m\u00f6glich. Die folgende Abbildung verdeutlicht den Weg der Daten von der Datenlieferung bis zur Konvertierung nach MARCXML:<\/p>\n<figure id=\"attachment_1094\" aria-describedby=\"caption-attachment-1094\" style=\"width: 802px\" class=\"wp-caption alignnone\"><a href=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/workflow.png\"><img loading=\"lazy\" decoding=\"async\" class=\" wp-image-1094\" src=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/workflow-300x181.png\" alt=\"\" width=\"802\" height=\"484\" srcset=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/workflow-300x181.png 300w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/workflow-768x464.png 768w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/workflow-619x374.png 619w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/workflow.png 915w\" sizes=\"auto, (max-width: 802px) 100vw, 802px\" \/><\/a><figcaption id=\"caption-attachment-1094\" class=\"wp-caption-text\">Workflow des Mappings mit Catmandu (Quelle: Tim Friedrich)<\/figcaption><\/figure>\n<p style=\"text-align: justify;\">Der Umgang mit dem ungewohnten Linux-Betriebssystem und die Meisterung der Funktionen von Catmandu stellten eine Herausforderung dar. Auch das Erzeugen von validen MARC-Datens\u00e4tzen mitsamt Kontrollfeldern (vor allem die aufw\u00e4ndige Bef\u00fcllung der Felder \u201eleader\u201c und \u201e008\u201c) war nicht simpel. Eine allgemeine Herausforderung bei dem Mapping ist die Unspezifit\u00e4t der Ausgangsdateien. Diese Metadaten stammen aus einem gro\u00dfen Pool an Teilnehmerbibliotheken mit verschiedenen Standards und werden zu einfachen Feldern zusammengelegt. Aus diesen wieder informationsreiche MARC-Datens\u00e4tze herzustellen war komplex.<\/p>\n<p style=\"text-align: justify;\">Die Projektergebnisse wurden in einem Wiki dokumentiert. Als n\u00e4chste Schritte sollen die erzeugten Datens\u00e4tze ausf\u00fchrlich auf Fehler \u00fcberpr\u00fcft werden. Auch wird getestet, wie gut gro\u00dfe Datenmangen konvertiert werden k\u00f6nnen. Zudem werden die ersten Lieferungen f\u00fcr den GVI vorbereitet.<\/p>\n<figure id=\"attachment_1095\" aria-describedby=\"caption-attachment-1095\" style=\"width: 300px\" class=\"wp-caption aligncenter\"><a href=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/librecat-marc.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"size-medium wp-image-1095\" src=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/librecat-marc-300x294.jpg\" alt=\"\" width=\"300\" height=\"294\" srcset=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/librecat-marc-300x294.jpg 300w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/librecat-marc-768x752.jpg 768w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/librecat-marc-619x606.jpg 619w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2021\/04\/librecat-marc.jpg 800w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/a><figcaption id=\"caption-attachment-1095\" class=\"wp-caption-text\">(Quelle: LibreCat)<\/figcaption><\/figure>\n<p style=\"text-align: justify;\">Projektzeitraum: M\u00e4rz 2020 bis August 2020<br \/>\nProjektbetreuer*in: Petra Maier<br \/>\nKontakt: tim.friedrich@hbz-nrw.de<\/p>\n","protected":false},"excerpt":{"rendered":"<p>von Tim Friedrich F\u00fcr Bibliotheken ist MARC ein weitverbreitetes Austauschformat. Wie kann man bibliographische Daten in dieses Format umwandeln? In diesem Projekt wurde dies exemplarisch mit dem Tool Catmandu und den Daten des Fernleihindex des hbz durchgef\u00fchrt.<\/p>\n","protected":false},"author":3,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"ppma_author":[72],"class_list":["post-1090","post","type-post","status-publish","format-standard","hentry","category-uncategorized"],"authors":[{"term_id":72,"user_id":3,"is_guest":0,"slug":"seitz","display_name":"Christian Seitz","avatar_url":"https:\/\/secure.gravatar.com\/avatar\/e1bdb5349ee9992175a4036266ff9a3b948338150a8e374e357da3eec87aea0e?s=96&d=blank&r=g","0":null,"1":"","2":"","3":"","4":"","5":"","6":"","7":"","8":""}],"_links":{"self":[{"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/posts\/1090","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/comments?post=1090"}],"version-history":[{"count":6,"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/posts\/1090\/revisions"}],"predecessor-version":[{"id":1301,"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/posts\/1090\/revisions\/1301"}],"wp:attachment":[{"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/media?parent=1090"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/categories?post=1090"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/tags?post=1090"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/ppma_author?post=1090"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}