Über Tethys RDR (tethys.at) werden innerhalb der Organisation generierte Forschungsdaten als open data und nach den FAIR Prinzipien veröffentlicht.
1. Wie komme ich zu den Daten?
Die Daten können grundsätzlich auf der Website https://www.tethys.at/search durchsucht und in der Detailansicht heruntergeladen werden. Es kann jedoch vorkommen, dass Daten und ihre Beschreibungen zwar auf Tethys veröffentlicht sind, aber vorübergehend nicht heruntergeladen werden können. In solchen Fällen liegt ein Embargo vor. Sobald das Embargo endet, werden die Daten automatisch freigegeben und stehen dann wie gewohnt zum Download bereit.
2. Ich sehe die Metadaten, kann aber nicht die Daten herunterladen!
Einige Datenpublikationen unterliegen einem Embargo. Das bedeutet, dass aktuell nur die Beschreibung der Daten auf Tethys verfügbar ist. Sobald das Embargo endet, werden die bereits hochgeladenen, aber noch gesperrten Daten automatisch freigeschaltet und können wie gewohnt heruntergeladen werden.
3. Wie kann ich die Datenpublikation zitieren bzw. darauf verweisen?
Jede Datenpublikation kann eindeutig über einen „Persistent Identifier“ identifiziert und aufgerufen werden. Im Tethys RDR wird hierfür die DOI (Digital Object Identifier) verwendet. Die DOI dient gleichzeitig als permanente Adresse (URI) der jeweiligen Datenpublikation. Sie ist einzigartig und kann weder geändert noch ersetzt werden. Wenn die DOI bekannt ist, kann man direkt auf die zugehörige Landingpage zugreifen oder darauf verweisen. Zu jeder Datenpublikation im Tethys RDR wird außerdem ein Zitiervorschlag bereitgestellt.
4. Werden die Daten nach der Veröffentlichung verändert?
Wir stellen sicher, dass die Daten unverändert bleiben und dauerhaft referenzierbar sind. Nach der Veröffentlichung werden die Daten weder bearbeitet noch in irgendeiner Form manipuliert. Falls Änderungen notwendig sind, erfolgt dies ausschließlich durch eine transparente wie auch nachvollziehbare Versionierung.
5. Wie lange werden die Daten verfügbar sein?
Die Verfügbarkeit der Daten ist für mindestens 10 Jahre garantiert. Unser Ziel ist es jedoch, die Daten dauerhaft zugänglich zu machen.
6. Handelt es sich bei Tethys um ein offiziell anerkanntes Forschungsdatenrepositorium?
Tethys ist ein offiziell anerkanntes Forschungsdatenrepositorium. Es ist bei re3data.org registriert und trägt das CoreTrustSeal Zertifikat, das es als vertrauenswürdiges und nachhaltiges Repositorium für geowissenschaftliche Daten auszeichnet.
7. Ist Tethys ein zertifiziertes Repositorium?
Ja, Tethys ist mit dem als vertrauenswürdiges und nachhaltiges Forschungsdatenrepositorium für geowissenschaftliche Daten und trägt das CoreTrustSeal Zertifikat.
8. Was bedeutet das CoreTrustSeal Zertifikat?
CoreTrustSeal bietet eine Zertifizierung für Datenrepositorien, die auf den grundlegenden Anforderungen für vertrauenswürdige Repositorien basiert. Diese Anforderungen beschreiben die wichtigsten Eigenschaften, die ein vertrauenswürdiges Repositorium haben sollte.
1. Warum soll ich in Tethys publizieren?
Es gibt viele gute Gründe, Daten in einem Forschungsdatenrepositorium zu veröffentlichen. Zusätzlich gibt es einige besonders überzeugende Gründe, fachbezogene Forschungsdaten in Tethys zu veröffentlichen. Diese werden in der folgenden Übersicht dargestellt:
Allgemeiner Mehrwert
Spezifische Vorteile von Tethys:
2. Welche Daten werden im Forschungsdatenrepositorium aufgenommen?
Im Tethys RDR werden georeferenzierte, aufbereitete und strukturierte Daten veröffentlicht, die fachlich relevant sind. Zusätzlich können Grafiken, Bilder oder Texte veröffentlicht werden, wenn sie das Verständnis der Daten verbessern. Die Entscheidung, welche Daten aufgenommen werden, trifft in der Regel das Redaktionsteam von Tethys RDR.
3. Was muss ich machen um Daten publizieren zu können?
Wenn klar ist, dass die Daten zu Tethys passen und die erforderlichen Anforderungen bekannt sind, kann das Tethys-Team (repository@geosphere.at) kontaktiert werden. Die genauen Anforderungen für die Datenpublikation sind im Handbuch nachzulesen. Eine dort verfügbare Checkliste im Tethys hilft dabei, schnell zu prüfen, ob die Daten veröffentlicht werden können. Die endgültige Entscheidung, welche Daten aufgenommen werden, trifft das Redaktionsteam von Tethys.
4. Können extern erstellte Forschungsdaten publiziert werden?
Aktuell werden auschließlich Forschungsdaten in das Tethys RDR aufgenommen, die von oder in Zusammenarbeit mit GeoSphere Austria erstellt wurden. Bei grundsätzlichem Interesse wenden Sie sich bitte an das Tethys-Team unter: repository@geosphere.at.
5. Kann ich die Forschungsdaten publizieren, wenn mehrere Personen diese erstellt haben?
Dies ist möglich, wenn die beteiligten Personen nachweislich informiert wurden und in die Datenpublikation eingewilligt haben. Der Einreicher (Submitter) trägt die Verantwortung für die Datenpublikation und muss die Einverständniserklärung seiner Co-Ersteller (Creators) einholen. Der Tethys RDR-Editor kann sich diese Einverständniserklärung vorlegen lassen oder die Co-Ersteller persönlich über die bevorstehende Datenpublikation informieren.
6. Was muss ich machen, wenn die Daten auf Fremddaten basieren?
Alle Rechte an den verwendeten Fremddaten müssen vollständig geklärt sein. Das bestehende Nutzungsrecht muss mindestens die Weiterverarbeitung der Daten erlauben. Zudem ist zu überprüfen, ob das Nutzungsrecht mit der gewählten Creative Commons Lizenz kompatibel ist.
7. Werden die Daten als Open Data publiziert?
Ja, die Daten werden gemäß den Prinzipien von Open Science als Open Data und mit Open Access veröffentlicht.
8. In welchen Formaten darf ich die Daten publizieren?
Es gibt eine Reihe von Formaten, die die Kriterien „Offenheit“, „Sicherheit“ und „Nachhaltigkeit“ erfüllen. Derzeit unterstützt Tethys RDR folgende Formate für die Daten und deren Zusatzmaterialien: ascii-grid, csv, txt, gpkg, jpeg, pdf (PDF/A), png, shp und NetCDF.
9. In welcher Sprache kann ich die Daten publizieren?
Es wird empfohlen, die Datensätze in Englisch zu veröffentlichen, um eine internationale Reichweite zu gewährleisten. Unabhängig von der Publikationssprache müssen die Datenpublikationen jedoch sowohl einen englischen als auch einen deutschen Haupttitel sowie Abstract/Zusammenfassung enthalten. Bereits zu Beginn des Upload-Prozesses muss die Sprache festgelegt werden, und ein späterer Wechsel ist nicht mehr möglich. Je nach gewählter Sprache muss die gesamte Publikation einheitlich in dieser Sprache verfasst werden.
Neben dem klassischen Abstract kann auch ein Kapitel zu den angewandten Methoden und/oder einer technischen Beschreibung hinzugefügt werden. Es wird jedoch empfohlen, ausführlichere Beschreibungen in Form eines PDFs zusammen mit den Datensätzen zu veröffentlichen.
10. Welche Informationen müssen in der Datenpublikation vorhanden sein?
Die Datenpublikation besteht aus drei Teilen: Der erste Teil enthält die Metadaten, die während des Uploads der Daten abgefragt bzw. automatisch erstellt werden. Der zweite Teil umfasst die optionale Datenerläuterung. Der dritte Teil besteht aus den eigentlichen Datensätzen.
Metadaten: Metadaten sind das Herzstück jeder digitalen Publikation, da sie dafür sorgen, dass die Daten auffindbar, sichtbar und durchsuchbar sind. Wenn standardisierte Metadatenelemente verwendet werden, können die Daten auch automatisiert durchsucht und außerhalb des Repositoriums zugänglich gemacht werden. Tethys RDR nutzt standardisierte Metadaten und unterstützt deren Maschinenlesbarkeit.
Datenbeschreibung bzw. -erläuterung: Die Datenerläuterung bietet eine detaillierte Beschreibung der publizierten Datensätze, die über die standardisierte Metadatenbeschreibung hinausgeht. Sie ist ein wesentlicher Bestandteil der Publikation, insbesondere wenn die Metadaten allein nicht ausreichen, um die Daten vollständig zu beschreiben. Das Ziel der Datenerläuterung ist es, die Daten so zu dokumentieren, dass sie auch in der Zukunft – mindestens 10 Jahre, idealerweise viel länger – verstanden und nach wissenschaftlichen „Best Practices“ genutzt werden können. Die Datenerläuterung kann entfallen, wenn es eine umfassende Textpublikation gibt, die diese Funktion übernimmt und den Nutzern zugänglich ist. In diesem Fall muss der Link zur Textpublikation in den Metadaten angegeben werden. Fehlt eine klare und verständliche Datenbeschreibung, werden die Daten im Tethys RDR nicht veröffentlicht.
Datensätze: Das Tethys RDR archiviert und veröffentlicht ausschließlich Datensätze. Diese bestehen aus mehreren logisch zusammengehörenden Daten, die ohne weitere manuelle oder technische Zwischenschritte direkt als Datensätze genutzt werden können.
11. Kann ich meine Datenpublikation einem Projekt zuordnen?
Es kann der Datenpublikation ein Projekt zugeordnet werden. Wenn das Projekt schon existiert, kann es direkt beim Hochladen der Daten ausgewählt werden. Falls das Projekt noch nicht angelegt ist, müssen die Projektdetails (Name, Bezeichnung, Beschreibung) dem Tethys RDR-Editoren-Team mitgeteilt werden.
Das Editoren-Team legt das Projekt daraufhin in der Datenbank an. Dafür benötigt er vorab die genannten Informationen in weniger als 100 Wörtern. Sobald das Projekt eingetragen ist, erscheint es bei der Datenpublikation in der Auswahlliste und kann ausgewählt werden.
12. Kann ich ein Embargo setzen und was muss ich dazu alles berücksichtigen?
Eine Datenpublikation kann bis zu zwei Jahre vor der Freigabe ohne Downloadmöglichkeit veröffentlicht werden.
Es gibt mehrere Gründe für eine Sperrung der Daten: Zum Beispiel kann ein Verlag verlangen, dass die Daten vor der Veröffentlichung des zugehörigen Textes bereitgestellt werden. Auch Förderer, die wirtschaftliche Interessen verfolgen, können eine temporäre Sperrung von bis zu zwei Jahre einfordern.
Falls ein Embargo nötig ist, können die Daten und Metadaten bereits im RDR veröffentlicht werden. Die Daten werden jedoch erst nach Ablauf des Embargos automatisch freigeschaltet. Bis dahin sind nur die Metadaten sichtbar, sodass die Publikation gefunden und gelesen werden kann.
Ein Vorteil dieser frühen Veröffentlichung ist der Schutz der Forschungsdaten vor unrechtmäßiger Nutzung durch Dritte. Vor dem Festlegen eines Embargos sollte geprüft werden, ob es notwendig ist und nicht den Interessen des Fördergebers widerspricht.
13. Muss ich meine Datenpublikation mit Keywords publizieren?
Keywords (Schlagworte) helfen Nutzern, Datenpublikationen schneller und einfacher zu finden. Es sind mindestens drei Keywords erforderlich.
Die Keywords sollten repräsentativ und eindeutig sein, um die Suche im Tethys und in anderen Diensten, die die Daten bereitstellen, zu erleichtern. Dabei ist es wichtig, keine Wörter aus dem Titel der Publikation als Keywords zu verwenden, da diese bereits bei der Suche berücksichtigt werden.
Derzeit unterstützt das Tethys RDR nur „unkontrollierte Keywords“. Eine Auswahlliste mit einem standardisierten Vokabular ist in Planung.
14. Gibt es ein Upload-limit?
Der Download von Datenpublikationen erfolgt nicht nur innerhalb der GeoSphere Austria, sondern weltweit unter unterschiedlichen technischen Bedingungen. Um die Datenbereitstellung so kompakt wie möglich zu gestalten, wurde die maximale Dateigröße auf 512 MB begrenzt.
Falls größere Datenmengen veröffentlicht werden sollen, sollte das RDR-Team kontaktiert werden.
15. Kann ich die Datenpublikation auf bereits existierende Publikationen verweisen?
Beim Submission-Prozess kann auf bestehende Daten- und Textpublikationen verwiesen werden. Dafür lassen sich verschiedene Beziehungen definieren.
Wichtig ist, nur nachhaltige Referenzen mit einem persistent Identifier (PID) zu nutzen, sodass die Links nicht ins Leere führen. Im Tethys RDR werden diese unter dem Metadatenelement „Dataset References“ beschrieben und klar definiert. Weitere Details dazu sind im Handbuch nachzulesen.
16. Wird die Datenpublikation überprüft (reviewed)?
Derzeit prüfen die Editoren Datenpublikationen nach eigenem Ermessen auf technische und inhaltliche Vollständigkeit. Bei Bedarf wird ein Fachexperte hinzugezogen, um die inhaltliche Vollständigkeit zu überprüfen.
Aktuell gibt es nur ein „Review on Demand“. Dabei kontrolliert das Editoren-Team die Datenpublikation auf formale Kriterien wie:
17. Wie können die Daten vor dem finalen Upload an den Editor übergeben werden?
Kleinere Datenmengen können direkt per E-Mail versendet werden. Für größere Datensätze sollten Filesharing-Systeme oder, sofern zugänglich, interne Verzeichnisse genutzt werden.
18. Werden die Entwurfspublikationen auch abgespeichert?
Ja, die Entwürfe und die dazugehörigen Korrespondenzen werden in einem eigenen Verzeichnis abgelegt.
19. Wie handhaben die Editoren den Reviewprozess?
Die Editoren machen Anmerkungen und weisen auf Fehler oder Unklarheiten hin, bearbeiten die Datenfiles jedoch nicht selbst. Korrekturen müssen von den Einreichenden oder Erstellenden vorgenommen werden.
Die Editoren prüfen die Daten und deren Beschreibung auf Nachvollziehbarkeit, Vollständigkeit und Plausibilität. Falls Datenbeschreibungen vorhanden sind, werden Korrekturen und Anmerkungen direkt darin vermerkt. Andernfalls wird ein separates Korrekturblatt erstellt.
Um unbeabsichtigte Veränderungen durch Dritte zu vermeiden, werden die Daten selbst von den Editoren nicht bearbeitet oder geändert.
20. Ich möchte verschiedene Datensatztypen gemeinsam publizieren. Ist das möglich?
Die kontrollierenden Editoren prüfen die Daten und deren Beschreibung auf Nachvollziehbarkeit, Vollständigkeit und Plausibilität. Falls es Beschreibungen zu den Daten gibt, werden Korrekturen und Anmerkungen direkt dort eingetragen. Falls nötig, wird ein separates Korrekturblatt erstellt. Die Editoren selbst verändern oder bearbeiten die Daten nicht, um sicherzustellen, dass sie nicht versehentlich verändert werden.
Datensatztypen: Dieses frei definierbare Metadatenelement dient dazu, Datensätze zu klassifizieren. Mit diesem Metadatenelement kann auch gezielt nach spezifischen Datensatztypen gesucht werden.
Um den Überblick über eine Datenpublikation zu behalten und sie leichter auffindbar zu machen, sollte sie nicht zu umfangreich sein. Es ist sinnvoll zu prüfen, ob die Daten in kleinere, besser handhabbare Einheiten aufgeteilt werden können. Diese Einheiten können miteinander verknüpft oder in Beziehung gesetzt werden.
Falls es sinnvoll ist, verschiedene Datensatztypen in einer Veröffentlichung zusammenzufassen, steht der Typ „Mixed Type“ als Auswahl zur Verfügung.
21. Gibt es einen genauen Workflow wie die Datenpublikation abläuft?
Es gibt einen Workflow, der den Publikationsablauf beschreibt. Dieser ist unter anderem im Handbuch nachzulesen.
22. Können bereits im Tethys RDR publizierte Forschungsstätten wieder gelöscht werden?
Sobald die Daten veröffentlicht sind, können sie weder verändert, ergänzt noch gelöscht werden. In Ausnahmefällen ist es möglich, den Zugriff auf Datensätze zu sperren, jedoch bleiben die Metadaten immer erhalten. Dies ist notwendig, um die Zitierfähigkeit und die wissenschaftliche Nachvollziehbarkeit jederzeit sicherzustellen.
Deshalb ist es besonders wichtig, die Publikation sorgfältig vorzubereiten und genau zu überlegen, wie die Daten und unter welcher Lizenz sie veröffentlicht werden sollen.
Die mit der Publikation verknüpfte Metadatenbeschreibung kann im Tethys RDR grundsätzlich nicht geändert, gesperrt oder gelöscht werden. In Ausnahmefällen können jedoch die veröffentlichten Datendateien gesperrt werden. Dadurch sind diese nicht mehr einsehbar, herunterladbar oder weiterverbreitbar.
23. Können nachträglich entdeckte Fehler in der Datenpublikation korrigiert werden?
Fehler in bereits veröffentlichten Datensätzen können nicht direkt korrigiert werden. Stattdessen besteht die Möglichkeit, den korrigierten Datensatz als neue Version zu veröffentlichen.
Rechtschreibfehler in den Metadaten können korrigiert werden. Wenn jedoch Informationen hinzugefügt oder entfernt werden, prüft die Tethys-Redaktion den Fall individuell ob eine Versionierung der Datenpublikation notwendig ist.
24. Gibt es eine Checkliste, um die wichtigsten Punkte in Blick zu halten?
Ja, es gibt eine Checkliste, die sowohl im Handbuch, als auch im Metadatenformular bereitgestellt wird.
1. Wohin kann ich mich wenden, wenn ich Fragen zu Tethys habe?
Wenn die Fragen nicht ausreichend über die Webseite, das Handbuch oder die FAQs beantwortet werden, kann das Tethys-Team per E-Mail unter repository@geosphere.at kontaktiert werden.
2. Handelt es sich bei Tethys um ein anerkanntes Forschungsdatenrepositorium?
Ja, Tethys RDR ist ein offiziell anerkanntes Forschungsdatenrepositorium, das sowohl im re3data.org verzeichnet als auch mit dem CoreTrustSeal zertifiziert ist.
3. Gibt es eine Datenpublikationsrichtlinie?
Ja, es gibt eine Datenpublikationsrichtlinie, die im online verfügbaren Handbuch nachgelesen werden kann.
4. Gibt es ein Mission Statement?
GeoSphere Austria hat den gesetzlichen Auftrag (GSAG §4(3)51), eine zentrale Dateninfrastruktur für Wissenschaft, Wirtschaft, Verwaltung und Gesellschaft aufzubauen und zu betreiben, die einen automatisierten Zugang ermöglicht. Ein wichtiger Teil dieser Infrastruktur ist Tethys RDR, wo unter anderem georeferenzierte, geowissenschaftliche Forschungsdaten wie Messungen, GIS-Daten, Experimente, Monitoring-Daten und 3D-Modelle frei zugänglich veröffentlicht werden. Diese Daten werden sowohl innerhalb der Organisation als auch in Zusammenarbeit mit anderen Institutionen erstellt.
Die Aufgabe von dem CTS zertifizierten Tethys RDR ist es, Forschungsdaten gemäß den FAIR- und Open-Data-Prinzipien bereitzustellen. Das bedeutet, dass die Daten auffindbar, zugänglich, interoperabel und wiederverwendbar sind. Großer Wert wird auf wissenschaftliche Nachvollziehbarkeit, nachhaltige Veröffentlichungen und langfristige Archivierung gelegt.
Als integralen Teil um den Publikationsprozess zu unterstützen, bietet das Tethys Team auch die redaktionelle Hilfe an. Alle veröffentlichten Daten erhalten einen Digital Object Identifier (DOI), wodurch sie eindeutig und einfach zitiert werden können.
5. Welche Leitlinie verfolgt Tethys?
In diesem digitalen Daten-Repositorium sollen vor allem digitale, georeferenzierte Forschungsdaten aus den Bereichen Geologie und Geophysik, die an oder im Auftrag von GeoSphere Austria erstellt wurden, veröffentlicht und nachhaltig mit einem DOI archiviert werden.
Die georeferenzierten Datenpublikationen und ihre Metadaten, die von Tethys RDR bereitgestellt werden, sind frei zugänglich und können je nach Nutzungsrechten verwendet werden.
Alle Datenpublikationen sind grundsätzlich sichtbar, außer diejenigen, die einem Embargo unterliegen. Diese Daten sind erst zu einem festgelegten Zeitpunkt verfügbar, die Metadaten sind zu jedem Zeitpunkt öffentlich zugänglich.
Das Tethys RDR basiert auf zwei etablierten Prinzipien aus der Wissenschaft: Open Science und die FAIR Guiding Principles, die das nachhaltige Archivieren und die Veröffentlichung von wiederverwendbaren wissenschaftlichen Daten ermöglichen.
Bereits veröffentlichte Daten können nicht gelöscht werden, es sei denn, es liegt ein rechtlicher Konflikt vor. In diesem Fall wird ein interner Prozess aktiviert, der die Metadaten und Daten von der Landingpage entfernt und den Grund für die Löschung angibt.
6. Setzt Tethys die FAIR Prinzipien um
Ja, die Forschungsdaten werden nach den FAIR Principles publiziert.
7. Welche Lizenzen stehen für die Datenpublikation zur Verfügung?
Für die Datenpublikation stehen nur zwei Varianten der Open Data Lizenzen nach Creative Commons zur Verfügung. Die bevorzugte Lizenz ist CC BY (nur Namensnennung), da sie zu 100 % mit den Open Science Prinzipien übereinstimmt. Wenn diese Lizenz nicht ausreicht, kann auch die eingeschränktere Lizenz CC BY-SA verwendet werden.
Wichtig: Wenn Fremddaten in die Daten eingeflossen sind, muss geprüft werden, ob die vorhandene Nutzungslizenz mit der gewählten Lizenz kompatibel ist.
8. Welche Metadatenstandards verwendet Tethys?
Tethys verwendet neben Dublin Core auch DataCite und ISO 19139.
9. Welche persistent Identifier verwendet Tethys?
Die publizierten Daten werden mit einem eingetragenen Digital Object Identifier (DOI) veröffentlicht.