Wie permanent sind Permalinks?

Eckhart Arnold und Stefan Müller

1 Danksagung
2 Das Wichtigste in Kürze
3 Einleitung
4 Was sind Permalinks?
5 Zur Vermeidung von Missverständnissen: Was sind keine Permalinks?
6 Exkurs: Sind permanente Identifikatoren (z.B. DOI) eine bessere Alternative?
7 Permalinks in der Praxis: Worauf zu achten ist
    7.1 Permalinks und Zitierbarkeit
    7.2 Permalinks auf Datenbanken und lebende Dokumente
    7.3 Die Abwicklung von Permalinks
    7.4 Zwei offene Fragen: Vorschaltseiten und Maschinenlesbarkeit von Permalinks
8 Ein Praxis-Beispiel: Warum BV-Nummern nicht für Permalinks taugen
9 Schlussbemerkung
10 Autoren
Literaturverzeichnis

7.2 Permalinks auf Datenbanken und lebende Dokumente

Während gedruckte Publikationen nach den Fahnenkorrekturen finalisiert sind, besteht bei digitalen Dokumenten und Daten die Möglichkeit, dass sie - solange sie verwendet werden - auch kontinuierlich geändert werden. Man kann sogar soweit gehen zu behaupten, dass gerade die Auflösung der scharfen Trennung zwischen Erstellungs- und Nutzungsphase neue Möglichkeiten für den wissenschaftlichen Forschungsprozess eröffnet. Neben der von Hubertus Kohle prägnant beschriebenen „publish first - filter later“-Strategie wären hier vor allem Wissenschaftsblogs zu nennen, die nicht nur den Austausch und die Wissenschaftkommunikation im Vorfeld späterer Fachveröffentlichungen verändern, sondern sich - wie das Polymath-Projekt (Gowers et al. 2016; Boulton 2012) vor Augen führt - tatsächlich auch schon als Mittel der massiv kollaborativen Forschung bei der Lösung schwieriger wissenschaftlicher Probleme bewährt haben, die im Rahmen der traditionellen Organisationsform der Wissenschaft in derselben Zeit kaum hätten gelöst werden können.

Für digitale Dokumente, die nach ihrer Veröffentlichung noch verändert werden, hat sich die Bezeichnung „lebende Dokumente“ eingebürgert. Wenn lebende Dokumente - wie das Beispiel des Polymath-Projekts zeigt - bei der Genese wissenschaftlicher Erkenntnis eine tragende Rolle spielen können, dann ist es wichtig, sie zitierbar zu gestalten. Ein wissenschaftspolitisches Eigentor wäre es dagegen, wenn man umgekehrt lebenden Dokumenten wegen ihres veränderlichen Charakters die Zitierfähigkeit kategorisch absprechen wollte. Für die Zitierbarkeit lebender Dokumente ist es erforderlich, Permalinks bereit zu stellen, die auf den Zustand eines lebenden Dokuments zu einem bestimmten Zeitpunkt verweisen. Eine Erläuterung, wie das technisch realisiert werden kann, würde an dieser Stelle zu weit führen. Wir möchten deshalb nur darauf hinweisen, dass dafür in Form von versionierenden Datenbanken, die die Geschichte der Änderungen an der Datenbank mitspeichern, und den aus der Softwareentwicklung bekannten Versionsverwaltungssystemen wohlbewährte Lösungen existieren.

Ähnliches gilt für die zunehmend wichtiger werdenden Forschungsdatenbanken. In Zukunft werden auch in den Geisteswissenschaften selbst die Forschungsergebnisse nicht mehr nur Textform haben, sondern teilweise auch in Form von Daten vorliegen. Damit wird es aber auch erforderlich, die entsprechenden Datenbanken zitierbar zu gestalten. Da Zitierungen eine der Währungen sind, in denen wissenschaftliche Anerkennung ausgetauscht wird, besteht ein sehr erwünschter Nebeneffekt darin, dass auf diese Weise auch die Arbeit der Recherche, Sammlung und Erarbeitung von wissenschaftlichen Datenbeständen als wissenschaftliche Leistung gewürdigt und ihren Urhebern zugeschrieben werden kann.

Die Bereitstellung von Permalinks für Datenbanken ist eine etwas komplexere Angelegenheit als die für lebende Dokumente, da hier nicht nur der zeitliche Verlauf zu berücksichtigen ist, sondern auch, dass sich die für eine wissenschaftliche Argumentation relevante „Datenbankstelle“ (in Analogie zur zitierten Textstelle) in der Regel aus bestimmten Datenbankabfragen ergibt. Ein Permalink auf die gesamte Datenbank wäre zu grobkörnig, ein Link auf einen einzelnen Datensatz zu feinkörnig, da in einer Abfrage ja in der Regel Daten aus mehreren Datensätzen (bei relationalen Datenbanken: mehreren Zeilen aus unterschiedlichen Tabellen) zusammengefasst werden. Inzwischen existieren aber auch hierfür durchdachte Konzepte, wie man die Zitierbarkeit von Datenbanken gestalten kann (Rauber et al. 2015; Rauber et al. 2016). So ist es im Prinzip möglich, Permalinks für konkrete Datenbankabfragen dynamisch zu erzeugen. Die technische Voraussetzung dafür ist, dass sich eine Abfrage über den Zustand der Datenbank zu einem bestimmten Zeitpunkt jederzeit rekonstruieren lässt. Das ist mit versionierenden Datenbanken leicht möglich, sofern neben der Datenbank noch ein Verzeichnis der Abfragen und der ihnen zugeordneten Permalinks geführt wird.

Die Frage der „Granularität“ von Permalinks stellt sich nicht nur bei Datenbanken, sondern bereits bei Texten. Bei Texten kann es jedoch notfalls genügen, wenn der Permalink auf ein Dokument von vielen hundert Seiten verweist und die Seitenzahl lediglich im Zitat genannt wird - wobei eine Verknüpfung, die direkt auf eine bestimmte Seite führt, natürlich die Bequemlichkeit erhöht. Bei Datenbanken erscheint es dagegen unpraktikabel, die konkrete Abfrage, die die Gestalt von vielen Zeilen Programmcode in einer Abfragesprache wie SQL haben kann, im Text eines wissenschaftlichen Aufsatzes anzuführen. Durch die Verwendung von Permalinks auf Datenbankabfragen, wie von Rauber et al. (2016) vorgeschlagen, erübrigt sich das, da sich das Ergebnis der zitierten Datenbankabfrage durch den Link wiederherstellen lässt.

Des Unterschiedes zwischen Permalinks auf elektronische Dokumente und Permalinks auf Datenbankabfragen sollte man sich bewusst sein. Während bei der Zitation von Permalinks auf Dokumente die bibliographischen Angaben das Dokument beschreiben und Permalinks lediglich den Ort des Dokuments im Internet angeben, ist bei Permalinks auf Datenbanksuchen nach dem eben beschriebenen Konzept die Suchanfrage und damit die Beschreibung des referenzierten Objekts im Permalink versteckt. Ein zerbrochener Permalink würde es daher schwerer machen, die Referenz zu rekonstruieren als im Falle eines elektronischen Dokuments. Die Praxis muss zeigen, ob das zu Problemen führt. Möglicherweise wird sich dann die Konvention herausbilden, die konkreten Suchanfragen im Anhang zu dokumentieren. Anhänge mit reichem Zusatzmaterial werden bei elektronisch publizierten Artikeln ohnehin zunehmend üblich.

t g+ f @