Wissenschaftliche Bibliotheken und der Umgang mit Forschungsdaten
Der Frage „Warum Forschungsdaten ein Thema für wissenschaftliche Bibliotheken sind„, war bereits ein früherer Blogbeitrag gewidmet. In diesem Beitrag befassen wir uns damit, wie Bibliotheken Forschende beim Umgang mit Forschungsdaten unterstützen können.
Dazu zunächst eine grundsätzliche Überlegung. Man kann sich nämlich auch fragen, wie sinnvoll es ist, dass sich einzelne Institutionen mit der Erhaltung ihrer Daten beschäftigen. Ist es nicht effizienter, internationale Datenarchive zu nutzen, idealerweise solche, die fachlich spezialisiert sind?
Tatsächlich sind etablierte fachspezifische Angebote der bevorzugte Ort für einen Teil der Daten. Jedoch gibt es solche Dienste bisher nur für erstaunlich wenige Wissenschaftszweige. Zusätzlich machen diese Datenarchive meist einschränkende Vorgaben zur Art der abzulegenden Daten und zur öffentlichen Freigabe. Das macht es schwierig, zusätzliche oder nicht frei zugängliche Materialien mitzuliefern. Auch Daten nur für eine begrenzte Zeit abzulegen, ist oft nicht möglich. Darum sind ergänzende institutionelle Angebote nötig. Mit ihnen können Hochschulangehörige die Anforderungen der guten wissenschaftlichen Praxis auf unkomplizierte Art erfüllen und bei Bedarf weitergehende Dienstleistungen nutzen.
Welchen Beitrag können wissenschaftliche Bibliotheken als Dienstleister in diesem Kontext erbringen? Beim Aufbau von Angeboten für den digitalen Datenerhalt gilt es, vorhandene Kompetenzen, Prozesse und Strukturen effizient und effektiv zusammenzuführen. So können die Duplizierung vorhandener Infrastrukturen oder ressourcenaufwändige Mehrspurigkeiten vermieden werden, wie z.B. auf der Ebene der Datenspeicherung. Das folgende Diagramm gibt Einblick in eine mögliche Aufgabenverteilung beim langfristigen Erhalt von Forschungsdaten:
Abbildung 1: Funktionale Ebenen in der Datenerhaltung; Matthias Töwe, Maximiliane Okonnek
Eine wesentliche Herausforderung im Umgang mit Forschungsdaten liegt darin, die dargestellten Einzelaspekte in einer kohärenten Infrastruktur für die Archivierung und – bei Bedarf – für die Veröffentlichung abzubilden. Der Aufbau einer solchen Infrastruktur ist komplex und wird nur unter Kooperation aller betroffenen Akteure und ihrer entsprechenden Kompetenzen gelingen.
Ohne den qualifizierten Input der Forschenden, ihre Dokumentation des Kontextes und ihre Einschätzung der zukünftigen Nutzung kann der Erhalt digitaler Daten kaum Erfolg haben. In der folgenden beispielhaften Darstellung zeigt sich das breite Spektrum an Informationen, die über die eigentlichen Ergebnisdaten hinaus im Prozess wissenschaftlicher Forschung entstehen können und für den sinnvollen Umgang mit den produzierten Daten benötigt werden.
Abbildung 2: Beispiel einer apparativen Messung –
Informationen, die für eine wissenschaftliche Nachnutzung benötigt werden und nur von den Forschenden geliefert werden können
Bibliotheken als Akteure
Eine Fülle an Informationen ist also notwendig, um den wissenschaftlichen Kontext hinreichend für mögliche weiterführende Forschung abzubilden. Und doch reicht diese allein für die langfristige Erhaltung der Daten oft nicht aus. Liegen weitere Angaben vor, kommen daher wissenschaftliche Bibliotheken und Datenarchive ins Spiel. Die Beschreibung von inhaltlichen, administrativen und technischen Eigenschaften mit Hilfe von standardisierten Metadaten gehört zu ihren Kernkompetenzen. Hochschulbibliotheken unterstützen bereits das elektronische Publizieren von Texten: angefangen bei der Vergabe einer ISBN oder eines DOI (Digital Object Identifier) über die Förderung von Open Access mit der Volltextablieferung an ein institutionelles Repositorium bis hin zur Erfassung von Publikationen von Hochschulangehörigen für die Bibliographie und das Reporting der Hochschule. Die Kompetenzen, die bei diesen Dienstleistungen zum Einsatz kommen, sind auch im Umgang mit Forschungsdaten relevant.
Viele Anforderungen an den Umgang mit Forschungsdaten zielen darauf, Datensätze als Begleitmaterial zu formalen Veröffentlichungen bereitzustellen oder sie als eigenständige, gut beschriebene Objekte verfügbar zu machen. So können sie nach Bedarf auf Publikationen verweisen oder von diesen zitiert werden. Es liegt nahe, die Verantwortung für die konvergierenden Abläufe für Publikationen und Forschungsdaten zusammenzuführen. Langfristig soll so die Veröffentlichung von gut beschriebenen Forschungsdatensätzen stärker auch als Bestandteil der Forschungsleistung gewürdigt werden. Unterstützt wird dies z.B. durch die eindeutige Zuordnung zu Autorinnen und Autoren via ORCID, die Open Researcher and Contributor ID (vgl. Blog-Beitrag vom März 2014). Auch hier sind Bibliotheken federführend aktiv.
In letzter Zeit gilt zusätzliche Aufmerksamkeit der Forderung von Förderorganisationen, bei der Antragstellung für ein Forschungsprojekt einen Datenmanagementplan (DMP) mitzuliefern. Dieser beschreibt, welche Daten im Projekt voraussichtlich erzeugt oder erhoben werden und wie mit ihnen umgegangen werden soll (Veröffentlichung, Möglichkeit der Nachnutzung, langfristige Erhaltung, Anonymisierung etc.). Hier können Bibliotheken vor allem dann unterstützen, wenn es im jeweiligen Fach keine klar etablierte Praxis mit anerkannten fachspezifischen Repositorien gibt. Sie können Kriterien für die Bewertung und Auswahl möglicher externer und interner Repositorien liefern und falls nötig bei der Einschätzung von deren Eignung helfen. Auch wenn Bibliotheken hier selbst noch Know-how gewinnen müssen, ist eine Bündelung der entsprechenden Expertise wesentlich effizienter, als diese an verschiedensten Stellen in der Hochschule immer wieder neu aufzubauen.
Die Komplexität von Datenformaten
Grosse Bedeutung hat die Diskussion der geplanten Dateiformate und ihrer Vor- und Nachteile für die spätere Weiterverwendung. Sie sollte zu einem möglichst frühen Zeitpunkt beginnen.
Die Wahl offener, standardisierter und gut dokumentierter Formate ist vor allem ein Anliegen der unbefristeten Langzeiterhaltung: Bei solchen Formaten besteht eine Aussicht, die entsprechenden Dateien bei Bedarf in aktuellere Nachfolgeformate umwandeln (migrieren) zu können, was bei proprietären Formaten weitgehend ausgeschlossen ist. Bibliotheken als Infrastrukturdienstleister sind in der Lage, ein entsprechendes Monitoring der vorhandenen Datenformate über lange Zeiträume hinweg zu gewährleisten und bei Bedarf Massnahmen in die Wege zu leiten.
Soweit die Theorie. Und was haben die Angehörigen der ETH Zürich in der Praxis davon?
Von 2010 bis 2013 hat die ETH-Bibliothek im Projekt Digitaler Datenerhalt die gleichnamige Fachstelle (www.library.ethz.ch/Digitaler-Datenerhalt) aufgebaut.
Abbildung 3: Screenshot Microsite „Digitaler Datenerhalt an der ETH Zürich“ im Wissensportal der ETH-Bibliothek
Die Fachstelle leistet einen Teil der genannten Unterstützung für den Umgang mit Forschungsdaten. Dabei kooperiert sie eng mit den Informatikdiensten der ETH Zürich. Ihre konkreten Aufgaben und Dienstleistungen werden Thema eines weiteren Blogbeitrages sein.
Dieses Werk unterliegt einer Creative Commons Attribution-ShareAlike 4.0 International Public License.
DOI Link: 10.16911/ethz-ib-1566-de