{"id":1383,"date":"2022-05-12T07:55:29","date_gmt":"2022-05-12T07:55:29","guid":{"rendered":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/?p=1383"},"modified":"2022-05-12T07:55:29","modified_gmt":"2022-05-12T07:55:29","slug":"semantische-anreicherung-von-lexikonartikeln-aus-rdk-labor-mit-normierter-terminologie","status":"publish","type":"post","link":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/semantische-anreicherung-von-lexikonartikeln-aus-rdk-labor-mit-normierter-terminologie\/","title":{"rendered":"Semantische Anreicherung von Lexikonartikeln aus RDK Labor mit normierter Terminologie"},"content":{"rendered":"<p><strong>von Christiane Elster<\/strong><\/p>\n<figure id=\"attachment_1384\" aria-describedby=\"caption-attachment-1384\" style=\"width: 801px\" class=\"wp-caption alignnone\"><a href=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.1.png\"><img loading=\"lazy\" decoding=\"async\" class=\" wp-image-1384\" src=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.1-300x155.png\" alt=\"\" width=\"801\" height=\"414\" srcset=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.1-300x155.png 300w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.1-1024x530.png 1024w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.1-768x398.png 768w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.1-1536x796.png 1536w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.1-619x321.png 619w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.1.png 1892w\" sizes=\"auto, (max-width: 801px) 100vw, 801px\" \/><\/a><figcaption id=\"caption-attachment-1384\" class=\"wp-caption-text\">Abbildung 1: Startseite von RDK Labor (Quelle: https:\/\/www.rdklabor.de\/)<\/figcaption><\/figure>\n<p style=\"text-align: justify;\">Die Online-Plattform RDK Labor (https:\/\/www.rdklabor.de) ist ein mit Semantic MediaWiki betriebenes Wiki, das aus dem 1927 gegr\u00fcndeten Reallexikon zur Deutschen Kunstgeschichte (RDK) hervorging. RDK Labor soll im Internet besser auffindbar werden und von gro\u00dfen Datensammlungen wie den Wikimedia-Projekten, Bibliothekskatalogen und Bilddatenbanken aus verlinkt sein. Das Ziel des am Zentralinstitut f\u00fcr Kunstgeschichte in M\u00fcnchen angesiedelten Praxisprojekts bestand darin, eine Datengrundlage f\u00fcr eine semantische Verkn\u00fcpfung der Online-Plattform im Netz zu schaffen. Dies geschah mit Hilfe eines Abgleichs (\u201eReconciling\u201c) einer repr\u00e4sentativen Testmenge von 250 Lemmata aus RDK Labor mit Wikidata und der Gemeinsamen Normdatei (GND). Dabei wurde mit der Software OpenRefine gearbeitet, einem Tool zur Bereinigung, Aufbereitung und Anreicherung von Daten.<\/p>\n<p><!--more--><\/p>\n<p><strong>Hintergrund<br \/>\n<\/strong>\u201eSemantic Web\u201c und \u201eNamed Entity Linking\u201c (Entit\u00e4tenverkn\u00fcpfung) stehen u.a. f\u00fcr die Vernetzung von Wissensbest\u00e4nden im Internet auf der Basis mitgef\u00fchrter Identifier. Dabei spielen normierte, kontrollierte Vokabulare und aus ihnen generierte Wissensgraphen eine wesentliche Rolle. Eine erfolgreiche und qualitativ hochwertige Entit\u00e4tenverkn\u00fcpfung h\u00e4ngt im Wesentlichen davon ab, wie viele der erkannten Entit\u00e4ten korrespondierenden Normdatens\u00e4tzen zugewiesen werden k\u00f6nnen (Abdeckung) und ob lexikalische Ambiguit\u00e4ten \u00fcberwunden werden k\u00f6nnen, um die Disambiguierung und eine korrekte Identifikation der Entit\u00e4t zu gew\u00e4hrleisten (Verkn\u00fcpfungsqualit\u00e4t).<\/p>\n<p><strong>Projektdurchf\u00fchrung<br \/>\n<\/strong>Das Projekt gliederte sich in vier Phasen: Im Anschluss an die Projektinitalisierung erfolgte das \u201eReconciling\u201c der Testmenge mit Wikidata und der GND. Wikidata ist die sprach\u00fcbergreifende Normdatei der Wikimedia-Projekte und umfasst 95 Mio. Datenobjekte. Die GND ist ein deutschsprachiges Normvokabular, das durch die Deutsche Nationalbibliothek und die Bibliotheksverb\u00fcnde kooperativ gef\u00fchrt wird. Sie besteht derzeit aus knapp neun Mio. Eintr\u00e4gen. Die anschlie\u00dfende Phase der Auswertung zielte auf die Ermittlung semantischer Schnittmengen und lotete M\u00f6glichkeiten aus, RDK Labor im Internet durch semantische Verkn\u00fcpfungen sichtbarer zu machen. Die Abschlussphase diente vor allem der Niederschrift des Projektberichts.<\/p>\n<p>Beim \u201eReconciling\u201c der Testmenge in OpenRefine wurden die Matchings entsprechend der Art der Beziehung zwischen RDK Labor-Lemmata und Wikidata-Items bzw. GND-S\u00e4tzen differenziert und in verschiedenen Spalten abgelegt. Dabei wurden grundlegend zwei Beziehungstypen unterschieden: \u201eSame as\u201c-Beziehungen bestehen, wenn die Begriffe der Normdateien den RDK Labor-Lemmata semantisch vollst\u00e4ndig entsprechen, d.h. wenn die Lemmata 1:1 abgebildet werden. Um \u00c4hnlichkeitsbeziehungen handelt es sich dagegen, wenn sich nur semantische \u00dcberschneidungen zwischen RDK Labor-Lemmata und Wikidata-Items bzw. GND-S\u00e4tzen ergeben. Dabei k\u00f6nnen die Begriffe der Normvokabulare semantisch weiter gefasst sein als die Lemmata \u2013 in diesem Fall handelt es sich um \u201ebroader terms\u201c (b.t.). Andere sind semantisch enger gefasst, man kann bei ihnen daher von \u201enarrower terms\u201c (n.t.) sprechen. Die \u00dcberg\u00e4nge zwischen den verschiedenen Kategorien sind allerdings flie\u00dfend.<\/p>\n<figure id=\"attachment_1385\" aria-describedby=\"caption-attachment-1385\" style=\"width: 800px\" class=\"wp-caption alignnone\"><a href=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.2.png\"><img loading=\"lazy\" decoding=\"async\" class=\" wp-image-1385\" src=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.2-300x169.png\" alt=\"\" width=\"800\" height=\"450\" srcset=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.2-300x169.png 300w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.2-1024x576.png 1024w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.2-768x432.png 768w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.2-1536x864.png 1536w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.2-619x348.png 619w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.2.png 1920w\" sizes=\"auto, (max-width: 800px) 100vw, 800px\" \/><\/a><figcaption id=\"caption-attachment-1385\" class=\"wp-caption-text\">Abbildung 2: OpenRefine-Projekt \u201eRDK Labor\u201c mit Facettierung der Testmenge (Quelle: Christiane Elster)<\/figcaption><\/figure>\n<p style=\"text-align: justify;\"><strong>Projektergebnisse<br \/>\n<\/strong>Die Auswertung des \u201eReconcilings\u201c orientierte sich an zwei zentralen Gr\u00f6\u00dfen, der Abdeckung und der semantischen Qualit\u00e4t der Matchings:<\/p>\n<p style=\"text-align: justify;\">Die Abdeckung als quantitativ ermittelbare Gr\u00f6\u00dfe demonstriert, wie viele Lemmata der Testmenge mit korrespondierenden Normdatens\u00e4tzen in Wikidata und der GND gematcht werden konnten. Die allgemeine Abdeckung, die Matchings aus allen Beziehungstypen einschlie\u00dft, betr\u00e4gt bei Wikidata 82%, bei der GND 77% (Abbildung 3). Ermittelt man die Abdeckung differenziert nach Beziehungstypen, erh\u00e4lt man entsprechend geringere Zahlen. Bei gut f\u00fcnfzig Prozent der Test-Lemmata war ein 1:1-Matching mit Wikidata (54%) und der GND (55%) m\u00f6glich. Fazit: Die Abdeckung ist bei Wikidata und der GND sehr \u00e4hnlich; die Normvokabulare Wikidata und GND gleichen sich also trotz ihrer unterschiedlichen Gr\u00f6\u00dfe in der Abdeckung des untersuchten Korpus.<\/p>\n<figure id=\"attachment_1386\" aria-describedby=\"caption-attachment-1386\" style=\"width: 801px\" class=\"wp-caption alignnone\"><a href=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.3.png\"><img loading=\"lazy\" decoding=\"async\" class=\" wp-image-1386\" src=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.3-300x169.png\" alt=\"\" width=\"801\" height=\"451\" srcset=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.3-300x169.png 300w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.3-619x348.png 619w, https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-content\/uploads\/2022\/02\/Elster_Blogbeitrag_Abb.3.png 720w\" sizes=\"auto, (max-width: 801px) 100vw, 801px\" \/><\/a><figcaption id=\"caption-attachment-1386\" class=\"wp-caption-text\">Abbildung 3: Allgemeine Abdeckungsrate in Wikidata und der GND (Quelle: Christiane Elster)<\/figcaption><\/figure>\n<p style=\"text-align: justify;\">Die Qualit\u00e4t der semantischen Beziehung zwischen den Lemmata und den gematchten Normbegriffen ist in den ermittelten Abdeckungsraten nur sehr eingeschr\u00e4nkt sichtbar. Sie wird vor allem durch den grundlegenden Charakter der Normvokabulare Wikidata und GND im Vergleich zum Vokabular von RDK Labor bestimmt. Allgemeine Beobachtungen w\u00e4hrend des Matching-Prozesses zeigten, dass die GND dem Vokabular der RDK Labor-Lemmata in semantischer Hinsicht \u00e4hnlicher ist als Wikidata. Insbesondere der ikonographischen Ausrichtung von RDK Labor kommt die GND weit st\u00e4rker entgegen als Wikidata.<\/p>\n<p style=\"text-align: justify;\">Basierend auf den Ergebnissen der Auswertung wurden M\u00f6glichkeiten ausgelotet, \u00a0RDK Labor mit Normdaten anzureichern und mit externen Ressourcen im Internet semantisch zu verkn\u00fcpfen. Dabei erscheint eine fachspezifisch ausgerichtete Erh\u00f6hung der Sichtbarkeit durch eine semantische Verkn\u00fcpfung RDK Labors mit kunsthistorischen Rechercheinstrumenten vielversprechender als eine allgemeine Erh\u00f6hung der Sichtbarkeit durch Einbindung in Wikidata. Insbesondere der Kubikat, der Online-Katalog der dem Kunstbibliotheken-Fachverbund zugeh\u00f6rigen Bibliotheken, bietet sich f\u00fcr semantische Relationierungen an. Durch die Schaffung neuer normierter Suchm\u00f6glichkeiten k\u00f6nnte RDK Labor im Kubikat sichtbarer werden. Dar\u00fcber hinaus empfiehlt sich die Einbindung RDK Labors als externe Datenquelle in den gerade in Entwicklung befindlichen Kubikat LOD. Langfristig ist eine Verlinkung von RDK Labor mit externen Bilddatenbanken erstrebenswert, um die Lemmata mit dem sie betreffenden Bildmaterial, das im Internet frei verf\u00fcgbar ist, zu verkn\u00fcpfen.<\/p>\n<p>&nbsp;<\/p>\n<p>Projektzeitraum: April 2021 bis August 2021<br \/>\nProjektbetreuer*in: Prof. Dr. Klaus Lepsky<br \/>\nKontakt: christiane.martina.elster@gmail.com<\/p>\n","protected":false},"excerpt":{"rendered":"<p>von Christiane Elster Die Online-Plattform RDK Labor (https:\/\/www.rdklabor.de) ist ein mit Semantic MediaWiki betriebenes Wiki, das aus dem 1927 gegr\u00fcndeten Reallexikon zur Deutschen Kunstgeschichte (RDK) hervorging. RDK Labor soll im Internet besser auffindbar werden und von gro\u00dfen Datensammlungen wie den Wikimedia-Projekten, Bibliothekskatalogen und Bilddatenbanken aus verlinkt sein. Das Ziel des am Zentralinstitut f\u00fcr Kunstgeschichte in M\u00fcnchen angesiedelten Praxisprojekts bestand darin, eine Datengrundlage f\u00fcr eine semantische Verkn\u00fcpfung der Online-Plattform im Netz zu schaffen. Dies geschah mit Hilfe eines Abgleichs (\u201eReconciling\u201c) einer repr\u00e4sentativen Testmenge von 250 Lemmata aus RDK Labor mit Wikidata und der Gemeinsamen Normdatei (GND). Dabei wurde mit der Software OpenRefine gearbeitet, einem Tool zur Bereinigung, Aufbereitung und Anreicherung von &hellip; <a href=\"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/semantische-anreicherung-von-lexikonartikeln-aus-rdk-labor-mit-normierter-terminologie\/\" class=\"more-link\"><span class=\"screen-reader-text\">Semantische Anreicherung von Lexikonartikeln aus RDK Labor mit normierter Terminologie<\/span> weiterlesen<\/a><\/p>\n","protected":false},"author":3,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"ppma_author":[72],"class_list":["post-1383","post","type-post","status-publish","format-standard","hentry","category-uncategorized"],"authors":[{"term_id":72,"user_id":3,"is_guest":0,"slug":"seitz","display_name":"Christian Seitz","avatar_url":"https:\/\/secure.gravatar.com\/avatar\/e1bdb5349ee9992175a4036266ff9a3b948338150a8e374e357da3eec87aea0e?s=96&d=blank&r=g","0":null,"1":"","2":"","3":"","4":"","5":"","6":"","7":"","8":""}],"_links":{"self":[{"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/posts\/1383","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/comments?post=1383"}],"version-history":[{"count":6,"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/posts\/1383\/revisions"}],"predecessor-version":[{"id":1593,"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/posts\/1383\/revisions\/1593"}],"wp:attachment":[{"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/media?parent=1383"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/categories?post=1383"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/tags?post=1383"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/malisprojekte.web.th-koeln.de\/wordpress\/wp-json\/wp\/v2\/ppma_author?post=1383"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}