Research is inherently dynamic, leading to equally dynamic data. This dynamic nature of research data raises numerous questions for professionals in information management at research institutions, libraries, and computing centers. Despite the conceptual establishment of research data citation through persistent identifiers (PIDs) in some communities, practical challenges remain.

References

Compilation of Data Versioning Use cases from the RDA Data Versioning Working Group

Published
Authors Jens Klump, Lesley Wyborn, Robert Downs, Ari Asmi, Mingfang Wu, Gerry Ryder, Julia Martin, Data Versioning WG

Data versioning is a fundamental element to ensuring the reproducibility of research. Work in other RDA groups on data provenance and data citation, as well as the W3C Dataset Exchange Working Group, have highlighted that definitions of data versioning concepts and recommended practices are still missing. An important driver to more closely examine data versioning practices came from the work of the RDA Working Group on Data Citation, whose final report recognised the need for systematic data versioning practices. However, while the recommendations put forward by the RDA WG on Data Citation are well suited for relational databases that are accessed using database queries, the recommendations sparked a debate that highlighted the need for more general principles on data versioning and a clarification of the terminology used to describe versioning of data. This led to the formation of the RDA Working Group on Data Versioning. An early requirement for the new WG was to capture use cases where versioning requirements could not be met by the RDA WG on Data Citation recommendations. Numerous organisations and individuals were approached, or offered to contribute use cases. In the course of the active phase of the RDA Data Versioning Interest Group and then RDA Data Versioning Working Group, 38 use cases from about 33 organisations representing different domains and data types were documented. These are presented below along with contextual information including definitions, workflows and ‘best practices’ for versioning. Analysing the collected use cases and other resources on data versioning we were able to extract versioning patterns. These versioning patterns form the basis of the data versioning principles presented in the Final Report of the RDA Data Versioning Working Group. Version information: The version 1.0 is the original submission of the final report for RDA community review. The Version 1.1 has minor changes from the Version 1.0 following the community review.

Information Science
German

Dokumentation des Workshops "Forschungsdaten-Publikationen zwischen Dynamik und Persistenz" #PIDsBUA

Published

Das Projekt “PID-Referenzmodell für die Versionierung von Forschungsdaten” am Lehrstuhl für Informationsmanagement des Instituts für Bibliotheks- und Informationswissenschaft (IBI) an der Humboldt-Universität zu Berlin widmete sich der Versionierung von Forschungsdaten-Publikationen im Kontext laufender Diskussionen um die Reform der Forschungsbewertung aus infrastruktureller Sich. Das Projekt agierte im Spannungsfeld der Dynamik digitaler Forschungsprozesse und der damit verbundenen Forschungsdaten auf der einen Seite, sowie der Notwendigkeit der Persistenz von forschungsunterstützenden Informationsinfrastrukturen auf der anderen Seite. Obwohl die Zitation von Forschungsdaten - die im Sinne der FAIR-Prinzipien, mit persistenten Identifikatoren (PIDs) adressiert sind - in einigen wissenschaftlichen Communities mittlerweile konzeptuell etabliert ist, ergeben sich in der infrastrukturellen Praxis von Repositorien, Fachzeitschriften sowie deren Praktiken, Richtlinien und Standards weiterhin Herausforderungen, die insbesondere bei der Betrachtung von Forschungsleistung im Kontext von Open Science ersichtlich werden.  Forschung ist dynamisch, und auch die resultierenden Daten können dynamisch sein. Gerade diese Dynamik bei der Versionierung von Forschungsdaten wirft für Stakeholder im Informationsmanagement an wissenschaftlichen Einrichtungen und deren Bibliotheken und Rechenzentren vielfältige Fragen auf. Wenn dynamische Forschungsdaten auf Repositorien veröffentlicht werden, stellt sich beispielsweise die Frage nach der Erfassung dieser Datensätze im Bereich des Publikationsmanagements und der Dokumentation von Forschungsinformationen.  Während auf der einen Seite die Zuordnung von Forschungsleistung bei der Publikation dynamischer Datensätze sichergestellt werden soll, stellt sich auf der anderen Seite die Frage der Praxis bei der Erfassung dieser Datensätze. Das Projekt widmet sich diesem Spannungsfeld zwischen Dynamik der Daten und Persistenz der Infrastruktur. Ziel des Workshops war die Diskussion aktueller Fragen rund um die Entwicklung eines disziplinübergreifenden Referenzmodells für die Erfassung von Forschungsdaten im Kontext von Forschungsinformationen und der wissenschaftlichen Nachvollziehbarkeit von veröffentlichten Forschungsergebnissen, mit dem spezifischen Anwendungsfall der Versionierung von Forschungsdaten. Die Zielgruppe des Workshops waren Forschende und Professionals in wissenschaftlichen Einrichtungen in den Bereichen Forschungsdatenmanagement, Publikationsmanagement und Forschungsinformationen aus Wissenschaft, Bibliotheken, Rechenzentren und Administration. ---- The project "PID Reference Model for the Versioning of Research Data" at the Chair of Information Management at the Berlin School of Library and Information Science (IBI) at Humboldt Universität zu Berlin focused on the versioning of research data publications in the context of ongoing discussions about the reform of research evaluation from an infrastructural perspective. The project operated in the tension between the dynamics of digital research processes and the associated research data on one side and the necessity of persistence in research-supporting information infrastructures on the other side. Although the citation of research data - addressed in the sense of FAIR principles with persistent identifiers (PIDs) - is now conceptually established in some scientific communities, challenges continue to arise in the infrastructural practice of repositories, journals, and their practices, policies, and standards. These challenges become particularly evident when considering research performance in the context of Open Science. Research is dynamic, and the resulting data can also be dynamic. This dynamic nature of versioning research data raises various questions for stakeholders in information management at academic institutions and their libraries and data centres. For example, when dynamic research data are published in repositories, questions arise about capturing these datasets in publication management and documentation of research information. While the attribution of research performance in the publication of dynamic datasets is to be ensured, questions arise about the practices of capturing these datasets. The project addresses this tension between the dynamics of data and the persistence of infrastructure. The goal of the workshop was to discuss current issues surrounding the development of an interdisciplinary reference model for capturing research data in the context of research information and the scientific traceability of published research results, with the specific use case of versioning research data. The workshop's target audience included researchers and professionals in academic institutions in the fields of research data management, publication management, and research information from the fields of science, libraries, data centres, and administration.