docuteam packer: einfaches Tool für die Wissenschaft

Das Tool docuteam packer unterstützt Forschende dabei, ihre Dateien einfach zu strukturieren und mit Metadaten zu versehen. Dadurch wird eine automatische Übergabe an das ETH Data Archive ermöglicht. Insgesamt gibt es an der ETH Zürich drei Wege, um Daten im ETH Data Archive zu archivieren:

  1. Einmaliger Upload
    Am einfachsten ist der einmalige Upload über ein Webformular, der zum Beispiel für die Veröffentlichung von „Supplementary Material“ zu einer Publikation genutzt werden kann. Auch wenn in diesem Fall ein Paket mit mehreren Dateien geladen wird, kann nur dem Gesamtpaket eine Beschreibung mit Metadaten zugeordnet werden.
  2. Regelmässiger Upload oder grössere Datenmengen
    Für die regelmässige Ablieferung von ähnlich strukturierten Daten oder überhaupt von grösseren Datenmengen eignet sich eine so genannte Submission Application. Sie führt weitgehend automatisch vorhandene Metadaten und Dateien aus bestehenden Quellen zusammen und übergibt sie in einer geeigneten Struktur an das ETH Data Archive. Da ein gewisser Entwicklungs- und Anpassungsaufwand für die Schnittstelle nötig ist und bereits Metadaten vorliegen müssen, eignet sich diese Methode vor allem für regelmässige oder Massenprozesse.
  3. Strukturiertes Sammeln von Daten im docuteam packer für die spätere Archivierung
    Zwischen den beiden zuerst genannten Methoden gibt es eine Lücke, die der docuteam packer schliesst: Zu einer Dissertation werden z.B. Daten über mehrere Jahre gesammelt und im Idealfall frühzeitig dokumentiert. In der Regel wird die Datensammlung aber erst am Ende der Arbeit abgeschlossen und gemäss den Vorgaben der Forschungsgruppe archiviert. Das Tool docuteam packer unterstützt diesen Prozess als Viewer und Editor.

Das Tool docuteam packer

Der docuteam packer ist eine Java-Anwendung, die von den Anwendern ohne Installation lokal ausgeführt werden kann. Die Anwendung erlaubt den Import von Ordnerstrukturen vom eigenen Dateisystem sowie den manuellen Aufbau von Strukturen aus Dateien und Ordnern. Auch ist es möglich, z.B. innerhalb einer Forschungsgruppe ein Template vorzugeben, in dem Doktorierende ihre Dateien erfassen und strukturieren können.

oberflaeche_docuteam-packer_k

Abbildung 1: Oberfläche des docuteam packer im Überblick

ordnerstruktur

Abbildung 2: Ausschnitt aus einer Ordnerstruktur im docuteam packer

Auf jeder Ebene können Metadaten eingetragen werden, das heisst Dateien und Ordner können beschrieben werden. Um diesen Prozess zu unterstützen, können Angaben, die für alle Elemente gelten sollen, auch von der obersten Stufe auf alle Inhaltsobjekte vererbt werden. Zusätzlich werden die Dateinamen in die Metadaten übernommen.

medadatenfenster

Abbildung 3: Ausschnitt Metadatenfenster im docuteam packer

Eine besonders hilfreiche Funktion ist die automatische Reservierung von Digital Object Identifiern (DOI) bereits bei der Datenerfassung. Diese sind zwar naturgemäss noch nicht aktiviert, solange Daten nur lokal gespeichert sind. Die späteren DOI sind den Forschenden aber so bereits bekannt und können beispielsweise in einem Manuskript zitiert werden.

Sobald Forschende im docuteam packer die Ablieferung eines kompletten Pakets oder von Teilen davon an das ETH Data Archive auslösen, wird ein Paket aus Metadaten und Dateien gebildet und für die Archivierung aufbereitet. In der Folge werden DOI beim internationalen Konsortium DataCite registriert und damit aktiv.

doi-url

Abbildung 4: Eingabe einer DOI-URL in einer Browser Adressleiste

files-im-eth-datad-archive

Abbildung 5: Zugriff auf Files im ETH Data Archive. Die Files wurden in diesem Fall direkt via DOI-URL aufgefunden.

Ziel der Erfassung im docuteam packer ist die spätere Archivierung im ETH Data Archive. Metadaten werden unter anderem im Wissensportal der ETH-Bibliothek sichtbar und über weitere Kanäle international gestreut, unter anderem auch über den Data Citation Index von Web of Science sowie über DataCite.

medaten_aufnahme

Abbildung 6: Metadaten-Aufnahme der Forschungsdaten im Wissensportal der ETH Bibliothek Zürich

Kommt der docuteam packer für mich in Frage?

Der docuteam packer wird für MacOS und Windows unterstützt und kann grundsätzlich auch unter Linux genutzt werden. Er wird bei Bedarf gezielt für eine Forschungsgruppe konfiguriert und ausgeliefert.

Das Arbeiten mit dem docuteam packer funktioniert am besten mit Datenpaketen mit einer Grösse von bis zu 2 GB. Die Handhabung und Installation der Anwendung gestalten sich in der Regel sehr einfach. Wir werden in diesem Blog in Kürze ein anschauliches Beispiel vorstellen, wie eine Forschungsgruppe ihr eigenes Datenarchiv mit Hilfe des docuteam packer in das ETH Data Archive überführt.

Weitere Angaben zur Verwendung des docuteam packer finden Sie auf der Website der Fachstelle Digitaler Datenerhalt.


Dieses Werk unterliegt einer Creative Commons Attribution-ShareAlike 4.0 International Public License.

CC-BY-SA

DOI Link: 10.16911/ethz-ib-2595-de

Leave a Reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.