Was ist iDAI.repo und wozu benutze ich es?

Die den Forschungsergebnissen zugrunde liegenden Forschungsdaten zusätzlich zu den klassischen Forschungsprodukten zu veröffentlichen ist inzwischen ein allgemein anerkannter Bestandteil der wissenschaftlichen Praxis, so auch in der Archäologie, den Altertumswissenschaften und den Humanities. Sie wird von dem DFG Kodex „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“ daher explizit gefordert. Ein fachspezifisches Datenportal hat im Vergleich zu einem generischen den Vorteil, dass Datensätze domänenspezifisch verstanden, mit Metadaten versehen und verknüpft werden können.

Das Konzept von Open Data gewinnt auch in den archäologischen Wissenschaften immer mehr an Bedeutung. iDAI.reporepo ermöglicht es den Mitarbeitenden des DAI und deren Projektpartnern Daten einfach und ohne hohen technischen Aufwand zu teilen. Dieses Angebot ergänzt die bereits bestehenden iDAI.world des Deutschen Archäologischen Instituts (DAI), welche einen höhren Grad der Strukturierung bieten, aber gleichzeitig einen höheren Arbeitsaufwand bei der Datenintegration voraussetzen. Insbesondere kleinere Forschungsprodukte und naturwissenschaftliche Daten sollen so einfach und transparent veröffentlicht und für andere Wissenschaftlerinnen und Wissenschaftler nachnutzbar gemacht werden.

Technische Basis von iDAI.repo ist die Open-Source Software CKAN.

Wie können Daten veröffentlicht werden?

Die selbstständige Nutzung von iDAI.repo für die Veröffentlichung von Forschungsdaten und -produkten ist Mitarbeitenden des DAI und ihren Kooperationspartnern vorbehalten.

Für die Veröffentlichung von Forschungsdaten aus Kooperationsprojekten werden folgenden Angaben benötigt:

  • Projektname, (angestrebte) Laufzeit,
  • Angabe zu den Kooperationspartnern,
  • Datenmenge (ggf. geschätzt)
  • Lizenzwunsch (CC-BY, CC-BY-SA präferiert),
  • Zeitvorstellungen und Deadlines,
  • vollständig (soweit möglich) ausgefüllte „metadata.pdf
  • sowie sonstigen Informationen, die für die Einschätzung der Forschungsdaten notwendig sind.

Die Forschungsdaten können entweder einzeln oder mit Hilfe eines Skripts in größeren Paketen hochladen werden.

Bitte beachten Sie, dass nur folgende Dateitypen in iDAI.repo aufgenommen werden:

csv, odt, rdf, txt, jpeg, jpg, png, tif/tiff, pdf, json, xlsx, xml, mkv, geojson, tsv, geotiff, txt, docx, ods, wld, svg, sql, jsonl, zip, dng, geotiff, dxf, siard, gpkg, qgs, qgz, mov, avi, ffv1, flac, wav, dae, obj, ply, warc, mhtml.

Bitte haben Sie Verständnis, dass wir bei kurzfristigen Anfragen nicht immer sofort reagieren können, wir antworten schnellstmöglich. Gern unterstützen wir Sie auch bei Drittmittelanträgen, falls Sie Ihre Forschungsdaten im Anschluss mit iDAI.repo veröffentlichen wollen.

Kontaktieren Sie uns unter: opendata@dainst.de

Einzelne Datensätze per grafischer Benutzerobefläche hinzufügen

Bitte nutzen Sie die Beschreibung auf der Confluence-Seite für iDAI.repo.

Größere Datenpakete importieren

Nachdem Sie mit uns Kontakt aufgenommen haben sind folgende Schritte notwendig:

  1. Laden Sie das folgende Formular herunter: metadata.pdf. Füllen Sie das Dokument vollständig aus.
    Die im Dokument abgefragten Metadaten spielen für die Archivierung Ihrer digitalen Daten eine wichtige Rolle. Darüber hinaus sind sie wichtig, um die Auffindbarkeit, Verständlichkeit und Nachnutzbarkeit der Daten zu gewährleisten. Die Vollständigkeit des Dokuments ist daher essentiell. Wenn Sie nicht sicher sind, welche Daten einzutragen sind, wenden Sie sich an die Kontaktmailadresse.
  2. Speichern Sie das Dokument zusammen mit allen Ihren zu hinterlegenden Dateien in einem eigenen Ordner.
  3. Archivieren Sie Ihren Ordner als "zip"-Archiv (Eine Anleitung finden Sie zum Beispiel hier für Windows)
  4. Senden Sie uns die vollständigen Daten an: opendata@dainst.de

Wenn Ihre Dateien zu groß für den Versand per E-Mail sind, verwenden Sie bitte einen Dateitransferdienst wie Dropbox, Cumulus, Wetransfer, oder Sendbig.

Falls dies nicht möglich ist, können Sie uns auch FTP-Zugangsdaten schicken. Sollte Ihnen kein FTP-Server zur Verfügung stehen, können wir Ihnen einen FTP-Zugang zur Verfügung stellen. Kontaktieren Sie uns hierzu möglichst frühzeitig.

Nach Erhalt der Daten werden diese von einer Administratorin / einem Administrator geprüft und bei Vollständigkeit veröffentlicht. Wenn weitere Informationen benötigt werden, werden Sie kontaktiert.

Was bedeutet Daten veröffentlichen und nachnutzbar machen?

Wenn Sie Ihre Daten in iDAI.repo veröffentlichen möchten ist es notwendig, Angaben zur Lizensierung der Daten zu machen. Nur so ist eine rechtssichere Nachnutzung der Daten gesichert., Eine Lizenz bietet zudem die Möglichkeit,festzulegen in welcher Weise die Daten von wem nachgenutzt werden dürfen.. Prinzipiell raten wir Ihnen dazu, sich an den standardisierten [CC-Lizenzen] zu orientieren und diese so offen wie möglich zu halten. Um eine tatsächliche Nachnutzung von Ihren Daten zu gewährleisten raten wir davon ab NC- oder ND-Lizenzen zu vergeben. DAI-Projekte müssen sich vor der Datenveröffentlichung über etwaige DAI-interen Vorgaben zur Lizensierung informieren.

Übersicht CC-Lizenzen

  • CC: Sie dürfen das Medium als Nutzerin / Nutzer verwenden.
  • BY: Sie müssen den Namen der lizenzgebenden Person(en) nennen.
  • SA: Sie müssen Ihr Werk mit der gleichen Lizenz versehen wie das darin enthaltene Medium.
  • NC: Sie dürfen ihr Werk nicht für kommerzielle Zwecke nutzen, wenn ein das Medium enthalten ist. (Achtung, hier gibt es „ungewollte Nebenwirkungen“)
  • ND: Sie dürfen das Medium nicht verändern oder kopieren.

www.creativecommons.org (02.11.2022)

Suche von Daten in iDAI.repo

Um die generelle Suchfunktion nutzen zu können müssen Sie sich nicht registrieren.

Sie haben die Möglichkeit sich die Reihenfolge der Datensätze nach verschiedenen Optionen anzeigen zu lassen: nach der Relevanz, nach auf- bzw. absteigenden Dateinamen oder nach dem letzten Bearbeitungsstand.

iDAI.repo unterstützt zwei Suchmodi. Beide können von dem gleichen Suchfeld aus benutz werden. Wenn die in das Suchfeld eingegebenen Suchbegriffe keinen Doppelpunkt (":") enthalten, führt iDAI.repo eine einfache Freitext-Suche durch. Enthält der Suchausdruck mindestens einen einen Doppelpunkt (":"), so führt iDAI.repo eine erweiterte Suche durch.

Einfache Freitext-Suche

Um Datensätze in iDAI.repo zu finden, geben Sie eine beliebige Kombination von Suchbegriffen in das Suchfeld auf der Startseite oder auf einer beliebigen Seite am oberen rechten Rand ein.

iDAI.repo sucht nach dem vollständigen Wort. Bei der einfachen Suche werden Wildcards (Platzhalter) nicht unterstützt.

iDAI.repo zeigt die erste Seite mit den Ergebnissen Ihrer Suche an. Sie können:

  • weitere Seiten mit Ergebnissen anzeigen,
  • die Suche wiederholen und dabei einige Begriffe abändern,
  • die Suche auf Datensätze mit bestimmten Tags, Datenformaten usw. einschränken, indem Sie die Filter in der linken Spalte verwenden.

Bei einer großen Anzahl von Ergebnissen können die Filter hilfreich sein, denn Sie können diese kombinieren, selektiv hinzufügen und entfernen, die Suche unter Beibehaltung der bestehenden Filter ändern und wiederholen.

Die von der Benutzerin / dem Benutzer in das Suchfeld eingegebenen Suchbegriffe definieren die Haupt-"Abfrage", die die wesentliche Suche darstellt.

Es gibt eine Reihe von Modifikatoren, welche die Parameter der Suchanfrage variieren. Das Zeichen + kennzeichnet Begriffe, die obligatorisch im Suchergebnis erhalten sein müssen. - Das Zeichen - kennzeichnet Begriffe, die nicht in dem Suchergebnis vorkommen sollen. Text, der in Anführungszeichen eingeschlossen ist (z. B. "San Jose") wird als Phrase behandelt. Standardmäßig werden alle von der Benutzerin / vom Benutzer angegebenen Wörter oder Phrasen als optional behandelt, es sei denn, ihnen geht ein "+" oder ein "-" voraus.

Beispiele für eine einfache Suche:

Suchanfrage ist fettgedruckt:

  • census sucht nach allen Datensätzen, die das Wort "census" in den Abfragefeldern enthalten.
  • census +2019 sucht nach allen Datensätzen, die das Wort "census" enthalten und filtert nur diejenigen, die auch "2019" enthalten, da es als obligatorisch behandelt wird.
  • census -2019 sucht nach allen Datensätzen, die das Wort "census" enthalten, und schließt "2019" aus den Ergebnissen aus, da es als verboten behandelt wird.
  • "european census" sucht nach allen Datensätzen, die den Ausdruck "european census" enthalten.

iDAI.repo wendet bei der Suche einige Vorverarbeitungen an, sodass z. B. nur der Wortstamm übrig bleibt.

Beispiel: Testing sucht nach allen Datensätzen, die das Wort "Testing" und auch "Test" enthalten, da es der Wortstamm von "Testing" ist.

Hinweis: Wenn der Name des Datensatzes Wörter enthält, die durch "-" getrennt sind, wird jedes Wort bei der Suche berücksichtigt.

Erweitere Suche

Wenn die Abfrage einen Doppelpunkt enthält, wird sie als feldbasierte Suche betrachtet und die Abfragesyntax wird für die Suche verwendet.

Dies ermöglicht die Verwendung von Wildcards (Platzhaltern) "*", Proximity Matching "~" und weitere Funktionen. Die grundlegende Syntax ist Feld:Begriff.

Beispiele für die erweiterte Suche:

  • title:european sucht nach allen Datensätzen, die im Titel das Wort "european" enthalten.
  • title:europ* sucht nach allen Datensätzen, die im Titel ein Wort enthalten, das mit "europ" beginnt, wie "europa" und "europäisch".
  • title:europe || title:africa sucht nach Datensätzen, die "europe" oder "africa" im Titel enthalten.
  • title: "european census" ~ 4 Bei einer Umkreissuche wird nach Begriffen gesucht, die in einem bestimmten Abstand zueinander stehen. In diesem Beispiel wird nach Datensätzen gesucht, deren Titel die Wörter "european" und "census" innerhalb eines Abstands von 4 Wörtern enthalten.
  • author:powell~ iDAI.repo unterstützt die Fuzzy-Suche. Um eine unscharfe Suche durchzuführen, verwenden Sie das Symbol "~" am Ende eines Einzelwortbegriffs. In diesem Beispiel werden Wörter wie "jowell" oder "pomell" auch gefunden werden.

Angezeigte Ergebnisse

Wenn Sie einen passenden Datensatz gefunden und ausgewählt haben, zeigt iDAI.repo die Seite mit den Datensätzen an. Diese enthält:

  • Name, Beschreibung und andere Informationen über den Datensatz
  • Links zu und kurze Beschreibungen von jeder der Ressourcen-Registerkarten.
  • Aktivitätsstrom – zeigt den Verlauf der letzten Änderungen am Datensatz an
  • Gruppen – hier sehen Sie alle mit diesem Datensatz verbundenen Gruppen.

Wenn Sie einen passenden Datensatz gefunden haben, können Sie über die Schaltfläche "Folgen" auf der Datensatzseite über Änderungen an diesem Datensatz informiert werden. Um diese Funktion nutzen zu können, müssen Sie einen Account bei iDAI.repo haben und angemeldet sein.