FAQ & Glossar
Erfahren Sie mehr über verschiedene Themen aus dem Bereich Forschungsdaten in unseren FAQs. Die wichtigsten Begriffe finden Sie außerdem in unserem Glossar erklärt.
FAQs
Allgemeine Fragen
Die Research Data Services (RDS) sind eine gemeinsame Arbeitsgruppe, die sich aus Mitarbeiter*innen der Universitätsbibliothek und IT.SERVICES der RUB zusammensetzt und für die Evaluation und Etablierung sowohl einer nachhaltigen Infrastruktur als auch eines nachhaltigen Services für das Forschungsdatenmanagement verantwortlich sind.
Wir bieten Wissenschaftler*innen aller Berufs- und Karrierestadien und in jedem Stadium ihrer Forschungsprojekte Unterstützung im Forschungsdatenmanagement und im Umgang mit ihren Forschungsdaten. Dafür werden verschiedene
Service und Tools angeboten, wie z.B. Schulungen, Beratungen und unser Forschungsdatenrepository.
Erfahren Sie mehr über unsere Kontaktmöglichkeiten und lernen Sie unser Team kennen:
FDM steht für Forschungsdatenmanagement. Unter Forschungsdatenmanagement wird der Umfang an Maßnahmen zur Organisation, Dokumentation und Bewahrung aller Daten, die in einem Forschungsprozess genutzt oder erzeugt
werden, verstanden. FDM richtet sich an alle Disziplinen und umfasst unterschiedliche Forschungsdaten, die vom Fachkontext definiert werden. Es sichert den Zugang, die Nachnutzung, die Reproduzierbarkeit und Qualität
aller Forschungsdaten, die die Grundlage wissenschaftlicher Ergebnisse bilden.
Weitere Informationen zum Forschungsdatenmanagement finden Sie im Glossar unter dem Eintrag Forschungsdatenmanagement.
Bei Forschungsdaten handelt es sich um alle Daten, die in der wissenschaftlichen Arbeit entstehen, entwickelt oder ausgewertet werden. Sie werden vom Fachkontext definiert und variieren von Disziplin zu Disziplin.
So zählen zu Forschungsdaten u.a. Messdaten, Laborwerte, audiovisuelle Informationen, Texte, Surveydaten, Objekte aus Sammlungen oder Proben zu Forschungsdaten. Aufgabe des Forschungsdatenmanagements ist der systematische
Umgang mit diesen Daten.
Weitere Informationen zu Forschungsdaten finden Sie im Glossar unter dem Eintrag Forschungsdaten sowie hier:
Die FAIR-Prinzipien sollen ein nachhaltiges Forschungsdatenmanagement sichern, indem Daten und zugehörige Metadaten so aufbereitet und gespeichert werden, dass sie von anderen nachgenutzt werden können. FAIRe Daten
sind demnach Findable (Auffindbar), Accessible (Zugänglich), Interoperable (Interoperabel), Reusable (Wiederverwendbar).
Weitere Informationen zu den FAIR-Prinzipien und FAIR Data finden Sie im Glossar unter dem Eintrag „FAIR Data“.
DMP steht für Datenmanagementplan. Ein Datenmanagementplan begleitet den gesamten Forschungsprozess und unterstützt diesen nicht nur in den Punkten Planung bzw. Antragstellung, sondern regelt darüber hinaus Prozesse
wie Archivierung und Datenpublikation.
Eine ausführliche Erklärung zum DMP finden Sie im Glossar unter dem Eintrag „DMP“.
Praktische Fragen
Die konkrete Anforderungen an den Inhalt und Aufbau eines Antrages variieren je nach Fördergeber, Format und Disziplin stark. Viele Fördergeber erwarten bereits bei der Antragsstellung Informationen zum Umgang mit
den Forschungsdaten. Teilweise wird z. B. ein Datenmanagementplan verlangt.
Eine gute Orientierung, welche Angaben in Anträgen zum Umgang mit Forschungsdaten gemacht werden sollen, bietet die
DFG-Checkliste. Für diese Checkliste stellen wir eine
Ausfüllhilfe für Sie bereit.
Auf unserer Seite “ Projekte und Anträge“ finden Sie weitere Informationen zu Förderanträgen. Sollten Sie Fragen zu diesem Thema haben, kontaktieren Sie uns! Wir helfen Ihnen gerne.
Handelt es sich um einen DFG-Antrag? Schauen Sie auf
die DFG-Checkliste zum Umgang mit Forschungsdaten und unsere zugehörige Ausfüllhilfe.
Auch bei vielen weiteren Fördereinrichtungen können Sie sich daran orientieren. Zu den Angaben zum Umgang mit Forschungsdaten gehört sowohl der Umgang mit den Daten (Speicherung, Dokumentation, Verantwortlichkeiten
etc.) während des Projekts als auch die Publikation, die Nachnutzung und die Archivierung der Daten. Ein Datenmanagementplan beinhaltet Angaben zu diesen Aspekten des Forschungdatenmanagements und sollte schon vor
Beginn eines jeden Forschungsvorhabens, d. h. innerhalb des Planungsprozesses, erstellt werden.
Für das Erstellen des Datenmanagementplan können Sie das Tool zum Forschungsdatenmanagement RDMO benutzen. Sollten Sie weitere Fragen zum Thema Datenmanagementplan und Förderanträge von Forschungsdaten haben, beraten wir Sie gerne.
Der langfristige Erhalt von Forschungsdaten ist ein wichtiger Teil des Forschungsdatenmanagements. Für das Speichern von Forschungsdaten bietet die RUB verschiedene Services an, wie z. B.
unser Forschungsdatenrepository,
Sciebo, den
Fileservice/Netzlaufwerk und den
Backupdienst. Bei einem Backup werden alle Dateien für den Notfall gesichert, dafür allerdings nur für eine relativ kurze Zeit. Für eine längere Aufbewahrung von Daten eignet sich die Archivierung.
Sollten Sie weitere Fragen zum Thema Speicherung und Archivierung von Forschungsdaten haben, beraten wir Sie gerne.
Eine einheitliche Benennung und Struktur der Forschungsdaten sorgt dafür, dass nicht der Überblick über die Erhebungen sowie Experimente verloren geht und nicht versehentlich mit verschiedenen Versionen eines Datensatzes gearbeitet wird.
Für das Strukturieren von Daten gibt es verschiedene Methoden:
Sie können flache Ordnerhierarchien (max. 3-4 Ebenen), sprechende Namen und die Trennschärfe der verwendeten Bezeichnungen benutzen. Das Beibehalten von Dateiendungen (z. B. csv, tiff) ist dabei wichtig. Zusätzlich
sollte das Benennungssystem und die Struktur in einer Readme.txt-Datei dokumentiert werden. Sollten Sie Ihre Daten regelmäßig bearbeiten oder ergänzen, empfiehlt sich die Versionerung von Daten. Angemessene Methoden
sind die korrekte Dateibenennung oder die Verwendung von Versionierungssoftwares wie Git (Link). Ein Beispiel für die Versionierung durch Benennung ist die drei Ebenen-Versionierung: Major. Minor. Revision (z. B.
1.0.0).
Die Research Data Services bietet Schulungen zur Nutzung von Git im Forschungsprozess an. Sollten Sie weitere Fragen haben, kontaktieren Sie uns gerne.
Metadaten sind Daten, die zur Beschreibung von Forschungsdaten verwendet werden. Diese Art der Dokumentation hat den Vorteil, dass die Daten dadurch auffindbar und nachvollziehbar sind. Welche Metadaten während des Forschungsprozesses vergeben werden müssen, ist vom Themengebiet, Forschungsprojekt und vom Fördergeber abhängig.
Ihre Metadaten sollten aber mindestens folgende Fragen beantworten können:
Fragen zu Services
Kontaktieren Sie
uns gerne! Gemeinsam finden wir einen geeigneten Beratungstermin für Sie.
Jede Fachcommunity und jedes Forschungsprojekt ist individuell und hat eigene spezifische Bedarfe. Auch Fördergeber haben individuelle Erwartungen und und fordern bereits bei der Antragstellung Informationen zum Umgang mit Forschungsdaten.
Aus diesem Grund ist eine persönliche Beratung im Bereich FDM besonders wichtig.
Wir beraten Sie bei sämtlichen Fragen zu folgenden Themen:
Hier finden Sie die Termine für unsere nächsten Veranstaltungen und Schulungen zum Forschungsdatenmanagement. Sollten Sie bspw. für Ihr Forschungsprojekt eine eigene Schulung zu einem oder mehreren FDM-Themen wünschen, nehmen Sie gerne Kontakt zu uns auf. Außerdem bieten wir eine Einführung in die verschiedenen Themenbereiche des Datenmanagements in Form eines Moodle-Kurses an.
Glossar
Langzeitarchivierung (LZA) von Daten soll deren langfristige Nutzbarkeit über einen nicht definierten Zeitraum hinweg sicherstellen. In vielen Fachdisziplinen hat sich allerdings eine zehnjährige Aufbewahrungfrist der Forschungsdaten als Standard etabliert. Weil dieser Zeitraum von ständigem technischen und soziokulturellen Wandel geprägt ist, bedarf es einer regelmäßigen Überprüfung der Daten im Hinblick auf die Erhaltung ihrer Nutzbarkeit.
Die LZA zielt auf den Erhalt der:
Um Datenverluste zu vermeiden, sollten regelmäßig, am besten zu einem festgelegten Zeitpunkt, Sicherheitskopien (engl. Backup) erstellt werden.
Quelle:
Die RUB bietet zusammen mit den IT-Services einen
Backup-Dienst an. Weitere Angebote (z.B. Speicherinfrastruktur und Organisationswerkzeuge für Forschungsdaten) befinden sich zurzeit im Aufbau.
Weitere Informationen zum Thema Datensicherheit finden Sie unter:
Um eine maximale Nachnutzbarkeit wissenschaftlicher Forschungsdaten zu gewährleisten, die prinzipiell dem Urheberrecht unterliegen können, kann die Vergabe zusätzlicher Nutzungsrechte z. B. durch eine entsprechende Lizenzierung der Daten in
Betracht gezogen werden. Die Verwendung liberaler Lizenzmodelle, insbesondere der weltweit anerkannten Creative-Commons-Lizenzen (CC), ist dabei eine Möglichkeit, Bedingungen für die Nachnutzung der publizierten Forschungsdaten nachvollziehbar
festzulegen.
Quelle: https://forschungsdaten.info/praxis-kompakt/glossar/#c269898
Das Dateiformat (manchmal auch Dateiart, Dateityp oder Datenformat genannt) wird bei der Speicherung einer Datei erzeugt und beinhaltet Informationen über die Struktur der in der Datei vorhandenen Daten, deren Zweck und Zugehörigkeit. Mithilfe der im Dateiformat verfügbaren Informationen können Anwendungsprogramme die Daten interpretieren und die Inhalte verfügbar machen. Das Format einer Datei kann in der Regel an einer entsprechenden Endung, die an den eigentlichen Dateinamen angehängt wird, erkannt werden. Diese besteht aus einem Punkt und zwei bis vier Buchstaben.
Die meisten Dateiformate wurden für eine spezielle Verwendung konzipiert und können nach gewissen Kriterien gruppiert werden:
Bei Dateiformaten wird weiter zwischen proprietären und offenen Formaten unterschieden. Bei sogenannten proprietären Formaten lassen sich die Dateien nur mit den dazugehörigen Anwendungs-, Hilfs- oder Systemprogrammen öffnen, bearbeiten und speichern
(zum Beispiel .doc/.docx, .xls/.xlsx). Offene Formate (zum Beispiel .html, .jpg, .mp3, .gif) ermöglichen es hingegen, die Datei mit Software verschiedener Hersteller zu öffnen und zu bearbeiten.
Dateiformate können beim Speichern aktiv durch Konvertierung geändert werden, wobei es aber zu Datenverlust kommen kann. Im wissenschaftlichen Bereich sollte vor allem auf die Kompatibilität, die Eignung zur Langzeitarchivierung und die verlustfreie
Konvertierung in alternative Formate geachtet werden.
Weiterführende Informationen finden Sie unter auf forschungsdaten.info.
Quellen:
Ein Digital Object Identifier (DOI) ist ein dauerhaft gültiger Bezeichner, mit dem digitale Objekte eindeutig identifiziert und somit auch referenziert werden können. DOI eignen sich besonders gut, um z.B. Artikel oder Datensätze zu zitieren, die in einem Repositorium veröffentlicht wurden. Sie bleiben über die gesamte Lebensdauer eines bezeichneten Objekts gleich.
Weitere Informationen zur DOI-Registrierung von Forschungsdaten finden Sie auf der Website der Universität Magdeburg.
Quellen:
- https://forschungsdaten.info/praxis-kompakt/glossar/
- http://www.fdm.ovgu.de/home/Kurz+erkl%C3%A4rt/Glossar.html#D
Ein Datenmanagementplan (DMP) strukturiert den Umgang mit Forschungsdaten eines wissenschaftlichen Projekts. Er beschreibt, wie während der Laufzeit und nach Projektende mit verwendeten Daten verfahren wird. Viele Drittmittelgeber (DFG, FWF, SNF, Horizon Europe, Volkswagenstiftung) erwarten für die Vergabe von Mitteln aus bestimmten Förderlinien Angaben zum Umgang mit Forschungsdaten als Teil eines Förderantrags. Ein formaler DMP wird zwar nur in den seltensten Fällen bislang gefordert, v.a. von der EU. Dennoch ist ein DMP für die Arbeit an einem Forschungsprojekt gewinnbringend. Insbesondere lässt sich in einem DMP über den gesamten Forschungsdatenlebenszyklus hinweg der aktuelle Stand und Besonderheiten vermerken. Somit ist es für die Verwaltung und um den Überblick zu behalten, hilfreich.
Quelle: https://forschungsdaten.info/themen/informieren-und-planen/datenmanagementplan/
Der Research Data Management Organizer (RDMO) ist ein Werkzeug zum Forschungsdatenmanagement und unterstützt Sie bei der Erstellung von Datenmanagementplänen.
FAIR steht für Findable (Auffindbar), Accessible (Zugänglich), Interoperable (Interoperabel), Reusable (Nachnutzbar). Die FAIR-Prinzipien sollen ein nachhaltiges Forschungsdatenmanagement sichern, indem Daten und zugehörige Metadaten so aufbereitet und gespeichert werden, dass sie von Dritten nachgenutzt werden können. Die Prinzipien beziehen sich sowohl auf die Datenhaltung selbst, als auch auf Infrastrukturen und Services und sollen Forschung transparenter und effizienter machen.
Wichtig für die Umsetzung ist unter anderem die Vergabe von umfangreichen Metadaten, persistenten Identifikatoren und eindeutigen Nutzungslizenzen, sodass die Daten für Menschen und Maschinen bestmöglich aufbereitet sind. Weitere Informationen und Tipps zur Umsetzung finden Sie hier.
Daraus ergibt sich ein disziplin- und projektspezifisches Verständnis von Forschungsdaten mit unterschiedlichen Anforderungen an die Aufbereitung, Verarbeitung und Verwaltung der Daten: dem sogenannten Forschungsdatenmanagement.
Weiterführenden Informationen finden Sie unter
Forschungsdaten.info und
Digitale Zukunft
Quellen:
- https://forschungsdaten.info/themen/informieren-und-planen/was-sind-forschungsdaten/#c502524
- https://forschungsdaten.info/praxis-kompakt/glossar/#c269824
- http://www.fdm.ovgu.de/home/Kurz+erkl%C3%A4rt/Glossar.html#F
Unter Forschungsdatenmanagement wird der Umfang an Maßnahmen zur Organisation, Dokumentation und Bewahrung aller Daten, die in einem Forschungsprozess genutzt oder erzeugt werden, verstanden. Es können an allen Punkten des Datenlebenszyklus strukturierte Maßnahmen ergriffen werden, um die wissenschaftliche Aussagekraft von Forschungsdaten zu erhalten, deren Zugänglichkeit durch Dritte für Auswertung und Analyse zu bewahren und die Nachweiskette zu sichern. FDM richtet sich an alle Disziplinen und umfasst unterschiedliche Forschungsdaten, die vom Fachkontext definiert werden.
Neben einer erhöhten Sichtbarkeit der eigenen Daten und der zugehörigen Forschung ermöglicht das FDM:
Darüber hinaus gewährleistet ein nachhaltiges Forschungsdatenmanagement die Umsetzung von Anforderungen und Standards aus den Fachdisziplinen, der Forschungsförderung, der Publikationsorgane sowie forschungsethischer Leitlinien.
Quellen:
- https://forschungsdaten.info/praxis-kompakt/glossar/#c269824
- http://www.fdm.ovgu.de/home/Kurz+erkl%C3%A4rt/Glossar.html#F
- https://www.fu-berlin.de/sites/forschungsdatenmanagement/glossar/index.html#section_f
Es ist wichtig, eine Lizenz zu finden, die für die Art von Material angemessen ist, das geöffnet wird. Die Anforderung, bei der Nachnutzung eines Artikels, Gedichts oder Essays Urheber*innen korrekt zu benennen, ist tief verankert in den Normen
der wissenschaftlichen Praxis und ist das Mittel, mit dem Nutzende eines Werkes im Kontext schätzen und nachvollziehen können, welche Teile davon ein Original sind.
Bei Daten gibt es allerdings häufig sehr gute Gründe, von der Pflicht zur Namensnennung abzusehen. Eine Anzahl prominenter Datenportale für das Kulturerbe, z.B. Europeana akzeptieren nur Daten, die unter der Creative Commons Zero-Lizenz (CC0)
zugänglich gemacht werden. Metadaten eines Werkes sind umso nützlicher, je besser sie mit anderen Daten kombiniert werden können (Linked Open Data). Es ist daher empfehlenswert, für Metadaten die CC0-Lizenz zu verwenden, da sonst u.a. die
Kette der Namensnennungen sehr lang werden kann.
Wichtig ist es, die Lizenzierung frühzeitig in den einzelnen wissenschaftlichen Arbeitsschritten mitzubedenken.
Folgende Punkte sollten beachtet werden:
Quelle: https://forschungslizenzen.de/#lizenzen
Metadaten bezeichnen alle zusätzlichen Informationen, die zur Interpretation der eigentlichen Daten, z. B. Forschungsdaten notwendig oder sinnvoll sind und die eine (automatische) Verarbeitung der Forschungsdaten durch technische Systeme ermöglichen. Metadaten werden daher oft als ‚Daten über Daten‘ bezeichnet.
Sie dienen dazu, die unterschiedlichen Informationen zu digitalen Objekten zu kategorisieren und zu charakterisieren:
- Technische Metadaten beinhalten z.B. Angaben zu Datenvolumen und Datenformat und sind für eine nachhaltige Datenspeicherung von zentraler Bedeutung.
- Deskriptive Metadaten (auch beschreibende oder Content-Metadaten genannt) geben Auskunft über die in digitalen Objekten enthaltenen (z.B. wissenschaftlichen) Informationen und entscheiden damit über deren Auffindbarkeit, Referenzierung und Nachnutzbarkeit. Damit bspw. Messdaten interpretierbar und damit nachnutzbar sind, ist die vollständige und korrekte Angabe der jeweils verwendeten (SI) Einheit unabdingbar.
Sinnvoll sind auch beschreibende Erläuterungen (etwa in Form eines Abstracts), die zusammen mit den (Forschungs-)daten aufbewahrt werden. Dazu zählen auch Hinweise auf
Nutzungsrechte, eingesetztes Equipment, verwendete Standards, wenn keine dazugehörige Publikation vorhanden ist.
Quelle:
https://www.forschungsdaten.org/index.php/Metadaten
„Die nationale Forschungsdateninfrastruktur (NFDI) soll die Datenbestände von Wissenschaft und Forschung systematisch erschließen, nachhaltig sichern und zugänglich machen sowie (inter-)national vernetzen. Sie wird in einem aus der Wissenschaft getriebenen Prozess als vernetzte Struktur eigeninitiativ agierender Konsortien aufgebaut werden.“
Quelle:
https://www.dfg.de/foerderung/programme/nfdi/index.html
Open Data (offene Daten) bezeichnet Daten, die von Dritten zu jedem Zweck (etwa zur Information, Auswertung oder auch bis hin zu wirtschaftlichen Weiterverwendung) genutzt, weiterverbreitet und weiterverwendet werden dürfen. Einschränkungen
der Nutzung sind lediglich erlaubt, um den Ursprung und die Offenheit des Wissens zu wahren, so kann etwa durch die Kennzeichnung mit CC-BY darauf bestanden werden, dass die Urheberin oder der Urheber genannt werden muss. Die Idee von offenen
Daten ist es, dass durch die freie Nachnutzung eine größere Transparenz gegeben ist und mehr Zusammenarbeit entsteht.
Weitere Informationen zu Open Data finden Sie
hier.
Quelle:
Open Science wird oft genutzt – aber selten konkretisiert. Open Science beschreibt den Ansatz, nicht nur die Ergebnisse des wissenschaftlichen Arbeitens transparent zu machen, sondern den kompletten Prozess. Die Ergebnisse öffentlich finanzierter
Forschung sollen nach Möglichkeit weltweit kostenfrei, ohne rechtliche oder technische Barrieren im Internet zur Verfügung gestellt und nachnutzbar gemacht werden. Je einfacher Forschungsergebnisse auffindbar und verfügbar sind, desto besser
können sie Grundlage weiterer Forschungsaktivitäten sein. […] Unter dem Begriff Open Science werden Strategien und Verfahren zusammengefasst, die den Wandel in der Forschungsmethodik, der organisatorischen und inhaltlichen Gestaltung der
Lehre, des Publizierens und der Informations- und Literaturversorgung sowie der Aufbewahrung von Forschungsdaten beschreiben.
Dazu gehören die Unterpunkte:
Mit dem offenen Zugang zu Wissen und Wissenschaft, ihren Publikationen, Daten und Software soll eine höhere Transparenz, Effizienz sowie Sichtbarkeit und eine damit einhergehende Qualitätsverbesserung und Steigerung des Vertrauens in Wissenschaft und Forschung erreicht werden. Die Etablierung von Citizen-Science-Projekten an der Universität fördert den partizipativen Forschungsansatz.
Quelle:
TU Berlin
Die Open Research and Contributor (ORCID) -iD ist ein international anerkannter persistenter Identifikator, mit dessen Hilfe Forschende eindeutig identifiziert werden können. Die iD ist verlagsunabhängig und kann dauerhaft sowie institutionsunabhängig von Forschenden für ihren wissenschaftlichen Output verwendet werden. Sie besteht aus 16 Ziffern, die in vier Viererblöcken dargestellt sind (z.B. 0000-0002-2792-2625). Die ORCID-iD ist als Identifizierungsnummer bei zahlreichen Verlagen, Universitäten und wissenschaftsnahen Einrichtungen etabliert und wird in den Workflow z. B. bei der Begutachtung von Zeitschriftenartikeln integriert.
Quelle: https://forschungsdaten.info/praxis-kompakt/glossar/#c269853
Um elektronisch veröffentlichte Daten jeder Art zuverlässig und dauerhaft finden, identifizieren und zitieren zu können, benötigen Sie einen dauerhaften Identifikator (Persistent Identifier). Ein Persistent Identifier ist ein eindeutiges Etikett
für ein bestimmtes digitales Objekt und bleibt immer gleich, auch wenn sich der Name oder der Speicherort einer Publikation ändert.
Beispiele für persistente Identifikatoren sind
URN (Uniform Resource Name),
DOI (Digital Object Identifier),
ORCID,
Researcher ID Thomson Reuters,
Scopus Author ID,
GND-Nummer (Gemeinsame Normdatei-Nummer),
Google Scholar Citations Profi,
ISNI (International Standard Name Identifier),
ISBN und
ISSN.
Digital Object Identifier (DOIs) ermöglichen es, Online-Publikationen zitierfähig zu machen.
Im Gegensatz zur eher kurzlebigen URL-Adresse bleibt der DOI als dauerhafter Identifikator erhalten. Die Universitätsbibliothek vergibt DOIs für digitale Objekte (z.B. Forschungsmaterialien, Aufsätze/Artikel, Digitalisate, Bilder) der Mitglieder
der Universität.
Quelle:
Uni Bamberg
RDMO ist ein Tool zum Erstellen von Datenmanagementplänen. Das Ziel von
RDMO ist es, den Umgang mit Daten in Ihrem wissenschaftlichen Projekt strukturiert zu planen, zu steuern und zu dokumentieren. Zusätzlich lassen sich die gesammelten Informationen als textuelle Ausgabe in Form eines Berichts oder Datenmanagementplans
ausgeben. Damit wird durch RDMO die Antragstellung bei Forschungsfördereinrichtungen wie EU, DFG und BMBF vereinfacht.
Bei Fragen und Problemen zu RDMO UA Ruhr können Sie die Anleitung zur Hilfe nehmen oder uns gerne direkt kontaktieren.
Ein Repositorium ist ein Speicherort für digitale Objekte. Neben Repositorien für Software und solche für Textdokumente gibt es auch Repositorien speziell für Forschungsdaten. Diese Repositorien dienen dem Publizieren und in der Regel auch gleichzeitig der Archivierung von Daten. Die meisten Datenrepositorien sammeln Metadaten in einer durchsuchbaren Datenbank und bieten beim Upload einer Datei die Möglichkeit, einen dauerhaften Identifier (z.B. einen DOI) zu generieren und eine Lizenz zu vergeben. Repositorien sind entweder öffentlich oder einem eingeschränkten Nutzer*innenkreis zugänglich. Weiter lesen
Quellen:
- https://www.fdm.ovgu.de/home/Kurz+erkl%c3%a4rt/Glossar.html#R
- https://forschungsdaten.info/praxis-kompakt/glossar/#c269859
Versionierung ermöglicht es, Änderungen nachzuvollziehen und ggf. auch zurückzunehmen. Dies ist besonders vorteilhaft, wenn die Dateien regelmäßig bearbeitet oder ergänzt werden. Als Methoden dafür empfiehlt sich die korrekte Dateibenennung oder die Verwendung von Versionierungssoftwares wie Git. Ein Beispiel für die Versionierung durch Benennung ist die drei Ebenen-Versionierung: Major.Minor.Revision (z.B. 1.0.0). Versioniert werden sollte zum einen während des Forschungsprozesses selbst, etwa um verschiedene Arbeitsversionen von Daten zu kennzeichnen, zum anderen bei nachträglichen Veränderungen an bereits veröffentlichten Forschungsdatensätzen, um Nachnutzenden zu ermöglichen, die korrekte Version eines Forschungsdatensatzes zu zitieren.
Quellen: