TU Dortmund Logo

UB Dortmund Logo

data@ubdo - Datenplattform der Universitätsbibliothek Dortmund Release 20230313

Motivation und Ziele

Wenn wir uns von der immer noch gängigen datensatzbasierten Verarbeitung von beschreibenden Daten entfernen und zu einem objektbezogenen Datenmanagement übergehen, können wir in Zukunft sicherstellen, dass sich jede beliebige Abfrage an unsere Metadaten stellen lässt.

Medienerschließung ist seit vielen Jahrzehnten eine zentrale bibliothekarische Dienstleistung. Neben der bibliothekarischen Erschließung durch klar definierte, langfristig gültige und überregional angewendete Regeln, nehmen zunehmend "Fremddaten" in kaum noch überschaubaren Mengen eine wichtige Rolle ein. Diese Metadaten werden in der Regel direkt von den Anbietern der Medien bereitgestellt und als Pakete in die Kataloge eingespielt – ohne, dass die Datensätze noch einzeln durch bibliothekarisches Fachpersonal geprüft werden könnten. Neben den Verlagen spielen auch die Autor/inn/en eine immer größere Rolle bei der Metadatenproduktion, indem sie beispielsweise auf Hochschulschriftenservern ihre Dokumente weitgehend selbst erschließen. In bestimmten Bereichen werden mittlerweile auch voll- oder teil-automatische Verfahren bei der Erschließung eingesetzt, wodurch sich die Heterogenität im Datenpool weiter erhöht. (vgl. auch Wiesenmüller, Pfeffer: Erschließung 2.0 - Von der Medienerschließung zum Metadatenmanagement. In: VDB-Mitteilungen 2014/1. S. 19ff.) Bereits 2009 stellten Coyle und Baker fest:

When it comes to metadata, one size does not fit all. In fact, one size often does not even fit many. The metadata needs of particular communities and applications are very diverse. The result is a great proliferation of metadata formats, even across applications that have metadata needs in common.

Um dem Ziel des Ausbaus von nutzerorientierten Services gerecht werden zu können, hat die UB Dortmund daher Struktutren zum Metadatenmanagement geschaffen. Nach einer ersten Analyse der Datenlage in der UB Dortmund, wurden Prinzipien des (Meta-)Datenmanagements aufgestellt:

  • Jeder Datensatz hat ein Mastersystem und ein Masterformat.
  • Datesätze werden automatisch verteilt und nicht mehrfach erfasst.
  • Linked Data ist Kernkonzept.
  • Im integrierten Bibliothekssystem (ILS) wird so wenig wie möglich und so viel wie nötig erfasst.
  • Es gibt ein Repositorium für digitale Objekte.

Die Datenplattform stellt das zentrale System zur Speicherung und Verbreitung der im Sinne unserer Prinzipien zum (Meta-)Datenmanagement aggregierten und erzeugten Metadaten dar. Aus den Prinzipien kommt hier insbesondere "Linked Data ist Kernkonzept" zum Tragen. Unterstützt wird diese Forderung durch unsere Leitlinien zu Metadaten (Open Data Policy). Für die Umsetzung der Prinzipien zum (Meta-)Datenmanagement hat die UB Dortmund im April 2014 eigens eine Fachgruppe "Datenmanagement und Informationssysteme" innerhalb der Bibliotheks-IT geschaffen.

Das Grundkonzept von Linked Data sieht vor, dass ein Netz aus Daten entstehen soll, welche aus verschiedenen Quellen zusammen automatisch weiterverwendet werden können (im Gegensatz dazu stellt das WWW ein Netz aus Webseiten dar). Im Linked Data gelten folgende Prinzipien:

  1. Verwende zur Bezeichnung von Objekten URIs.
  2. Verwende HTTP-URIs, so dass sich die Bezeichnungen nachschlagen lassen.
  3. Stelle zweckdienliche Informationen bereit, wenn jemand eine URI nachschlägt (mittels der Standards RDF und SPARQL).
  4. Zu diesen Informationen gehören insbesondere Links auf andere URIs, über die weitere Objekte entdeckt werden können.

(vgl. Tim Berners-Lee: Linked Data – Design Issues und Wikipedia)

Die UB Dortmund verfolgt das Ziel, ihre Service- und Bestandsinformationen als Linked Data im WWW über diese Plattform zur Verfügung zu stellen.

Um die Bestände angemessen und nutzbar beschreiben zu können, sind Daten über die Standorte der Medien von entscheidender Bedeutung. In einem sauberen Datenmodell sind daher auch Informationen zur physikalischen Struktur der Einrichtung notwendig, wozu neben der Beschreibung von Standorten, wie z.B. Campi, auch Gebäude und deren eigene Struktur wie Etagen gehören. Ferner sind diese in die Servicestruktur der UB bzw. der gesamten TU Dortmund einzubetten.

Ziel eines Projektes unter der Leitung der Fachgruppe "Datenmanagement und Informationssysteme" ist es, genau diese Strukturen als Linked Data zu erfassen. Zusätzlich ist die Organisationsstruktur zu erfassen, sowie die Sammlungsstruktur zu beschreiben.

Bei der Beschreibung der Objekte gelten folgende Vorgaben:

  • Verwendung des CIDOC CRM als Referenzontologie, für eine weitreichende und domainübergreifende semantische Vernetzung der Informationen
  • Anreicherung der HTML-Repräsentationen der Ressourcen durch schema.org-Vokabular, für eine möglichst weite Sichtbarkeit der Informationen

Weitere Informationen zur Modellierung der Daten und der damit definierten Application Profiles haben wir im Bereich Dokumentation zusammengestellt.

Offene Daten an der Universitätsbibliothek Dortmund

Was bedeutet das?

  • Seit dem 1. März 2011 stellt die Universitätsbibliothek Dortmund ihre bibliographischen Daten uneingeschränkt für die Öffentlichkeit zur Verfügung.
  • Allen interessierten Personen und Institutionen wird damit für die Metadaten aus unserem Katalog, aus der Hochschulbibliographie und aus Eldorado ein Nutzungsrecht eingeräumt. Unsere Katalogdaten sind seither gemeinfrei.
  • Mit dieser der Datenplattform erweitert die UB Dortmund das Angebot an Metadaten auf Strukturdaten und Statstikdaten.
  • Die Freigabe war ein Schritt in Richtung Linked Open Data. Bei Linked Open Data werden Daten aus unterschiedlichen Quellen in ein Datennetz (Semantic Web) integriert. Die Daten der UB Dortmund müssen zu diesem Zweck in web-konformes Linked Data umgewandelt werden.

Rechtliche Grundlagen

  • Die Daten werden so weit wie möglich unter der Creative Commons-Lizenz CC0 zum Download zur Verfügung gestellt. Damit gehören sie als gemeinfreie Daten allen und dürfen zu beliebigen Zwecken und Aufgaben genutzt werden. Jeder Person und Institution wird ein zeitlich und inhaltlich uneingeschränktes Nutzungsrecht an den Werken eingeräumt. Der Nutzer muss keine Rechenschaft über den Zweck der Nutzung ablegen und kann die Daten beliebig modifizieren.
  • Unsere Data Policy

Fragen?

Für Fragen und Anregungen stehen wir gerne zur Verfügung: opendata@ub.tu-dortmund.de

Datenschutz | Impressum
Creative Commons License This work is licensed under a Creative Commons Attribution 4.0 International License (CC BY 4.0).
W3C valid XHTML + RDFa