Persistent Identifiers als Katalysator für offene Forschungsdaten

Die Non-Profit-Organisation DataCite engagiert sich seit mehr als fünf Jahren für einen leichteren Zugang zu Forschungsdaten sowie für deren verbesserte Auffindbarkeit [1]. Das Ziel des Vereins ist dabei nicht allein die Sichtbarkeit von Forschungsdaten im Internet zu steigern. Auch ihre Akzeptanz als relevanter, zitierfähiger Bestandteil des wissenschaftlichen Leistungsausweises soll gestärkt werden. Ein Weg, dieses Ziel zu erreichen, führt über die Registrierung von Digital Object Identifiers (DOIs) für Forschungsdaten. DataCite ist eine offizielle Registrierungsagentur der International DOI Foundation. Die derzeit 24 DataCite-Mitglieder, zu denen auch der DOI-Desk der ETH Zürich zählt, ermöglichen es ihren Kunden, den sogenannten Data Centers, DOI-Namen für online zugängliche Forschungsdaten zu registrieren. abbildung-1-doi-desk

Abb. 1: Schritt für Schritt zur DOI-Registrierung (Slides auf Slideshare-Account der ETH-Bibliothek)

Wissenschaftlerinnen und Wissenschaftler erhalten durch eine DOI-Registrierung die Sicherheit, dass die von ihnen publizierten Daten über einen stabilen Identifikator dauerhaft adressierbar bleiben. Sie können die veröffentlichten Forschungsdaten in ihre Literaturliste aufnehmen und ihr so die angemessene Bedeutung in ihrem Leistungsausweis zukommen lassen. Andere Wissenschaftler können den Datensatz zitieren und sich auf die Daten und deren Produzenten berufen. Im optimalen Fall führt die standardisierte Referenz auf einen Datensatz in einer wissenschaftlichen Publikation dazu, dass die Datenproduzenten über Tools wie Google Scholar, den Data Citation Index oder Impactstory auf das neue Zitat aufmerksam werden und so über die Nachnutzung ihrer Daten stets aktuell informiert sind. Soweit die Theorie. In der Praxis stehen wir heute jedoch vor folgenden Herausforderungen:

  • Forschungsdaten sind nach wie vor grösstenteils nicht öffentlich zugänglich
  • Forschungsdaten werden nicht oder uneinheitlich mit Metadaten beschrieben
  • für das Referenzieren und Zitieren von Forschungsdaten hat sich bisher kein Standard durchgesetzt

Aus diesem Grund hat DataCite neben der DOI-Registrierung ein weiteres Handlungsfeld aufgemacht, um seine Anliegen voranzutreiben: die Entwicklung von Standards und Best Practices für die Publikation von Forschungsdaten

Forschungsdaten beschreiben

Für die Beschreibung von Forschungsdaten haben sich bisher nur in wenigen Disziplinen, wie zum Beispiel den Sozialwissenschaften, etablierte Standards herausgebildet. Die Entwicklung eines disziplin-unspezifischen Metadatenschemas für Forschungsdaten war daher nach der Gründung von DataCite Ende 2009 eine der ersten Prioritäten. Ein solches Schema könnte auch für fachspezifische Forschungsdatenarchive als Datenaustauschformat dienen und so deren Interoperabilität verbessern. Das DataCite Metadata Schema, in seiner ersten Version 2011 publiziert, erfüllt diesen Zweck. Das Schema wird von DataCite kontinuierlich weiterentwickelt und hat sich heute als Quasi-Standard für die Beschreibung von Forschungsdaten weitgehend etabliert. abbildung-2-datacite

Abb. 2: obligatorisch anzugebende Metadaten-Eigenschaften innerhalb des DataCite Schemas

Eines seiner wichtigsten Merkmale ist die Möglichkeit, über spezifische Metadatenelemente semantische Beziehungen zwischen Forschungsdatensätzen, deren Versionen oder Bestandteilen, sowie zwischen Publikationen und Forschungsdatensätzen standardisiert zu beschreiben [2].

Forschungsdaten zitieren

Auf Grundlage des DataCite Metadatenschemas empfiehlt DataCite, einen Forschungsdatensatz wie folgt zu zitieren:

Creator (PublicationYear): Title. Version. Publisher. ResourceType. Identifier

Ein praktisches Beispiels macht das noch nachvollziehbarer:

Swaminathan, R., Ramya, T., Karthik, C.S. (2013): Contortrostatin-Reprolysin Domain Structure. Swiss Institute of Bioinformatics. http://doi.org/10.5452/ma-c12zs

Die Bedeutung dieser Empfehlung liegt weniger in der Art und Weise, wie und in welcher Reihenfolge bestimmte Elemente des Zitats aufgeführt werden. Vielmehr liegt sie in der daraus abgeleiteten Forderung, dass Forschungsdaten überhaupt in standardisierter Form auf Webseiten, in Literaturlisten oder in wissenschaftlichen Publikationen zitiert werden sollten. Um dieses Anliegen zu unterstreichen, zählt DataCite auch zu den Unterzeichnern der „Joint Declaration of Data Citation Principles“.

Forschungsdaten publizieren

Für die DataCite-Mitglieder ergibt sich in der Zusammenarbeit mit ihren Kunden, den Betreibern von Forschungsdatenarchiven, oft die Möglichkeit, auf die Durchsetzung wichtiger Standards hinzuwirken und Best-Practice-Beispiele aufzuzeigen. So empfiehlt DataCite zum Beispiel, dass ein DOI-Name nie auf einen Forschungsdatensatz direkt auflösen soll, sondern auf eine sogenannte Landing Page. Abbildung-3-3D

Abb. 3: Beispiel eines publizierten Datensatzes:
Landing Page für ein anatomisches 3D-Modell der IT’IS Foundation, http://doi.org/10.13099/ViP-Thelonious-V2.0

Die Landing Page liefert dem Nutzer beschreibende Informationen zum Datensatz und ermöglicht es ihm dadurch, die Daten inhaltlich einzuordnen und im Sinne der Datenproduzenten nachzunutzen [3]. Auch zu anderen Themen, wie dem Umgang mit sich verändernden, sogenannten „dynamic data sets“ hat DataCite Empfehlungen ausgesprochen.

Erfahrungen aus der Praxis

In der Praxis des DOI-Desk der ETH Zürich zeigt sich, dass die Diskussion um die Veröffentlichung von Forschungsdaten in Schweizer Forschungseinrichtungen an Bedeutung gewinnt. An vielen Stellen fehlen jedoch noch die technischen und betrieblichen Voraussetzungen, um umfassende Angebote aufzubauen. Oftmals steht im Erstkontakt mit potentiellen Kunden des DOI-Desk deren Wunsch im Vordergrund, bereits vorhandene Daten mittels DOI zu publizieren und zitierbar zu machen. Die folgenden notwendigen Voraussetzungen auf Kundenseite müssen jedoch oftmals erst geschaffen werden:

  • die Sicherstellung der Persistenz und dauerhaften Verfügbarkeit der digitalen Objekte
  • das Erfassen von Metadaten
  • die Bereitstellung von Landing Pages

So mündet der scheinbar einfache Wunsch nach der Registrierung von DOI-Namen nicht selten in einen länger andauernden Beratungsprozess über die Anforderungen an elektronische Publikationsplattformen für Forschungsdaten und andere nicht-traditionelle Publikationsformate. Im optimalen Fall hat der neue DOI-Kunde am Ende dieses Prozesses einen wichtigen Schritt auf dem Weg zu einem vertrauenswürdigen Forschungsdatenrepositorium gemacht. Und der DOI-Desk hat einen weiteren Kunden gewonnen, dessen Forschungsdaten gut auffindbar sind und einer weltweiten Öffentlichkeit zur Nutzung zur Verfügung stehen.


[1] Jan Brase, Irina Sens, Michael Lautenschlager (2015): „The Tenth Anniversary of Assigning DOI Names to Scientific Data and a Five Year History of DataCite“. D-Lib Magazine 21(1/2). http://doi.org/10.1045/january2015-brase [2] Joan Starr, Angela Gastl (2011). „is CitedBy: A Metadata Scheme for DataCite“. D-Lib Magazine 17(2). http://doi.org/10.1045/january2011-starr. [3] Joan Starr, Eleni Castro, Mercè Crosas u.a. (2015). „Achieving human and machine accessibility of cited data in scholarly publications“. PeerJ Preprints 3:e697v4. http://doi.org/10.7287/peerj.preprints.697v4.


Dieses Werk unterliegt einer Creative Commons Attribution-ShareAlike 4.0 International Public License.

CC-BY-SA

DOI Link: 10.16911/ethz-ib-1797-de

Leave a Reply

Deine E-Mail-Adresse wird nicht veröffentlicht.