Glossar

Auffindbar

Auffindbar — Daten sollen sowohl von Menschen als auch von Computersystemen leicht auffindbar sein (Quelle).

Datenmanagementplan

Ein Datenmanagementplan (DMP) ist ein wichtiges Werkzeug, um den Umgang mit den eigenen Forschungsdaten zu strukturieren. DMP können sowohl als Checklisten dienen, als auch zur laufenden Dokumentation: von der Erhebung bis zur langfristigen Speicherung bzw. Veröffentlichung der Daten. Immer mehr Forschungsförderer, z.B. die EU oder das BMBF, fordern die Erstellung eines DMP.

Datentyp

Ein Datentyp ist eine schematische Beschreibung einer Datenstruktur. Er kann hierarchisch in beliebiger Granularität aufgebaut werden und sowohl für die Identifikation als auch für die strukturelle Beschreibung von Ressourcen verwendet werden. Um eine Maschinenlesbarkeit zu gewährleisten, werden Datentypen in einer Datatype Registry abgelegt.

FAIR

Gemäß der FAIR-Prinzipien sollen Daten "Findable, Accessible, Interoperable, and Re-usable" sein.

Forschungsdaten

sind alle Daten, die im Zuge eines wissenschaftlichen Vorhabens z. B. durch Quellenforschungen, Experimente, Messungen, Erhebungen oder Befragungen entstehen (Quelle / download).

Interoperabilität

Die Daten sollen ausgetauscht, interpretiert und zumindest halbautomatisiert mit anderen Datensätzen kombiniert werden können (Quelle).

Voraussetzung ist dafür dann eine gemeinsames Format oder eine Art Crosscompiler zwischen verschiedenen Formaten (das gehört jetzt eher nicht zur Definition, aber es scheint wichtig zu sein).

Metadaten

Metadaten oder Metainformationen sind strukturierte Daten, die Informationen über Merkmale anderer Daten enthalten.

Ontologie

Begriffssystem bestehend aus den Konzepten einer Wissensdomäne und deren Beziehungen untereinander (nach LIU, LING und M. TAMER ÖZSU (Herausgeber): Ontology, Encyclopedia of Database Systems. Springer-Verlag, 2009)

PID Information Profile

Ein PID Information Profile ist ein spezieller Datentyp, der den Inhalt eines PID Records beschreibt. Dadurch ist es möglich, ausgewählte Metadatenelemente im PID Record abzulegen, einen gegebenen PID Record automatisch zu validieren und für einen Tiefensuche, aufbauend auf PIDs, zu indexieren.

PID Record

PID Records sind die Sammlung an Schlüssel-Wert-Paaren die mit einer PID verknüpft sind. Im FAIR Digital Object Umfeld dienen PID Records der schnellen Entscheidungsfindung, da sie grundlegende Metadaten über die referenzierten Inhalte enthalten. Diese Metadaten werden in einem PID Information Profile definiert und können dagegen validiert werden.

Persistente Identifier

Persistente Identifier (PID) sind global eindeutige Zeichenketten zur Identifikation von Ressourcen. Sie werden in einer verteilten Infrastruktur verwaltet und können durch diese aufgelöst werden. Je nach PID System können mit einer PID zusätzliche Metadaten in Form eines PID Record verknüpft werden.

Provenienz

Provenienz bezeichnet allgemein die Herkunft einer Person oder Sache. Im Forschungskontext wird der Begriff genutzt, um die Herkunft und Entstehungsgeschichte von Daten zu bezeichnen. Die Aufzeichnung der Provenienz erlaubt es, nachzuvollziehen, woher Daten kommen sowie wer sie wann wie verändert hat. Zur Aufzeichnung wird der Prov-Standard verwandt.

Den Ursprung hat der Begriff als Bezeichnung der Herkunft von Kunstwerken und Kulturgütern, ihrer Erforschung widmet sich die Provenienzforschung. Dies wird ebenfalls auf Daten übertragen. Im DLR beschäftigt sich die Gruppe PROV@DLR mit dem Thema. Die Abteilung Intelligente und Verteilte Systeme (IVS) des Instituts für Softwaretechnologie (SC) beschäftigt sich ausserdem mit der Provenienzaufzeichnung von Software sowie Softwareentwicklungsprozessen.

Anwendung findet Provenienz in weiten Bereichen des DLR; insbesondere in den Bereichen Digitaler Zwilling und Simulationbased Certification spielt Provenienz eine Rolle.

Web Ontology Language

Die Web Ontology Language (OWL) ist eine Ontologie-Sprache für das Semantic Web mit formal definierter Interpretation. Sie ist eine Spezifikation des World Wide Web Consortiums (W3C). (nach OWL 2 Primer)

Wiederverwendbarkeit

Die Daten sind für die zukünftige Forschung wiederverwendbar und vergleichbar mit anderen Datenquellen. Auch Zitierbarkeit und Nutzungsbedingungen fallen unter dieses Schlüsselwort (Quelle).

Das impliziert unter anderem auch intensive Nutzung und Bereitstellung von Metadaten wie Versuchsumfeld, Versionsdokumentation u.a.

Zugänglichkeit

Die Daten sollen derart archiviert und gespeichert werden, dass sie mit Standardkommunikationsprotokollen sowohl maschinell als auch von Hand leicht abgerufen oder lokal genutzt werden können (Quelle).

Hier scheinen https oder ftp die Methoden der Wahl zu sein. Probleme gibt es bei vertraulichen oder anderweitig sensiblen Daten.