
PIDs für Forschungsdaten

Forschungsdaten spielen eine zentrale Rolle für die Reproduzierbarkeit, Nachvollziehbarkeit und Nachnutzung wissenschaftlicher Ergebnisse. Besonders in datenintensiven Forschungsfeldern – etwa bei der Arbeit mit Teilchenbeschleunigern, Satelliten oder Forschungsschiffen – entstehen umfangreiche und komplexe digitale Datensätze, deren langfristige Identifikation und Referenzierung essenziell ist.
Persistente Identifikatoren (PIDs) ermöglichen eine eindeutige, dauerhafte und maschinenlesbare Referenzierung von Forschungsdaten. Sie unterstützen eine verlässliche Zitierung, erhöhen die Sichtbarkeit der Daten und tragen maßgeblich zur Transparenz und Offenheit in der wissenschaftlichen Praxis bei. Darüber hinaus leisten sie einen wichtigen Beitrag zur Anerkennung von Forschungsleistungen jenseits klassischer Textpublikationen.
Welche PIDs werden verwendet – und wo sind sie erhältlich?
In vielen Datenrepositorien werden PIDs automatisch bei der Veröffentlichung von Forschungsdaten vergeben. Einen Überblick über verfügbare Repositorien und deren PID-Nutzung bietet z. B. das Verzeichnis re3data.org.
Verbreitete PIDs für Forschungsdaten sind:
- DOI (Digital Object Identifier)
Der DOI ist der am häufigsten genutzte Identifikator für Forschungsdaten. Er wird u. a. durch DataCite oder Crossref vergeben. - ARK (Archival Resource Key)
Der ARK ist ein PID-Typ, der vor allem in Archiven und langfristig angelegten Datensammlungen angewendet wird. Er ist besonders geeignet für die dauerhafte Referenzierung umfangreicher digitaler Bestände oder komplexer Ressourcenstrukturen. ARKs können u. a. über die California Digital Library beantragt werden. - ePIC (European Persistent Identifier Consortium)
Ein PID-System, das insbesondere im europäischen Forschungsumfeld (z. B. in den Erdsystemwissenschaften) eingesetzt wird.
Im Februar 2024 fand ein Online-Seminar zu PIDs für Forschungsdaten statt. Die Zusammenfassung der Diskussionen und die Vorträge können hier eingesehen werden.