Wie permanent sind Permalinks?

Eckhart Arnold und Stefan Müller

1 Danksagung
2 Das Wichtigste in Kürze
3 Einleitung
4 Was sind Permalinks?
5 Zur Vermeidung von Missverständnissen: Was sind keine Permalinks?
6 Exkurs: Sind permanente Identifikatoren (z.B. DOI) eine bessere Alternative?
7 Permalinks in der Praxis: Worauf zu achten ist
8 Ein Praxis-Beispiel: Warum BV-Nummern nicht für Permalinks taugen
9 Schlussbemerkung
10 Autoren
Literaturverzeichnis

6 Exkurs: Sind permanente Identifikatoren (z.B. DOI) eine bessere Alternative?

Kurzfassung: Bevor Ihr Geld für DOIs ausgebt, backt Euch lieber Eure eigenen Permalinks. Es funktioniert genauso gut und kostet nichts!

Interessanterweise erfreuen sich einige der eben beschriebenen alternativen Identifikatoren, insbesondere die DOI-Kennungen („Digital Object Identifier“), nach unseren Erfahrungen eines gewissen Prestiges, so, als würde ein digitales Dokument erst durch die Verleihung einer DOI zu einer respektablen elektronischen Publikation. Diese Prestigezuschreibung ist unserer Ansicht nach in der Sache nicht begründet und wohl eher durch die Analogie zur ISBN von Druckpublikationen zu erklären, deren Prestige als vermeintliches Mindestqualitätsmerkmal einer wissenschaftlichen Buchpublikationen allerdings auf ähnlichen Missverständnissen beruht. Denn Linkauflösersysteme (DOI, PURL, etc.) sind im Prinzip nichts anderes als Verzeichnisse, in denen einem digitalen Objekt-Identifikator (wie einer DOI) ein Link auf das Objekt zugeordnet wird. Sie garantieren nicht und können auch nicht garantieren, dass dieser Link gültig bleibt. Dies hängt wiederum allein von der Institution ab, die die Seite hinter dem Link bereitgestellt hat.

Anders verhält es sich mit dem verdienstvollen Angebot von archive.org, Netzseiten nicht allein mit einem Permalink zu versehen, sondern auch bei sich zu archivieren und damit selbst für die Verfügbarkeit der Ressource zu sorgen.

Der Nutzen von Linkauflösersystem besteht darin, dass die Adresse des Zielobjekts stillschweigend geändert werden kann und der Link immer noch funktioniert. Sofern man annimmt, dass das Linkauflösersystem von größerer Dauerhaftigkeit ist als die Permalinks der bereitstellenden Institutionen, bietet das einen Vorteil. Das könnte z.B. dann der Fall sein, wenn die Permalinks der bereitstellenden Institution einen Domain-Namen enthalten, der durch Verkauf oder Abtretung an eine andere Institution übergeht und dann nicht mehr verwendet werden darf. Es ist aber auch nur dann der Fall, wenn der neue digitale Ort des Zielobjekts an das Linkauflösersystem zurückgemeldet wird. Entsprechende Leitlinien dürften sich aber nur schwer durch den Betreiber des Linkauflösersystems erzwingen lassen, weil gerade der häufigste Fall, in dem dies nötig wäre, die Auflösung einer Institution ist. Es hängt nicht vom Betreiber des Linkauflösers, sondern von dessen Kunden ab, ob durch die Entkoppelungsfunktion eine größere Permanenz der (entkoppelten) digitalen Identifikatoren gegenüber selbsterstellten Permalinks der Kunden möglich ist. Möglicherweise wäre der Permanenz eher gedient, wenn man von vornherein versuchen würde, Repositorien möglichst bei solchen Institutionen anzusiedeln, denen man eine große Dauerhaftigkeit zutrauen kann, also etwa Staatsarchive, Nationalbibliotheken, aber auch solidere Webarchive wie das Internet Archive (archive.org) oder CLOCKSS (clocks.org).[8]

Wir haben daher Zweifel, ob die digitalen Identifikatoren einer zentralen Organisation wie der DOI-Foundation tatsächlich eine größere Permanenz verbürgen können als Permalinks. Theoretisch wird die Permanenz durch die Einführung eines zusätzlichen Zwischenschrittes zunächst einmal geschwächt, da sie nun von mindestens zwei Institutionen, dem Linkauflöser und dem Bereitsteller der digitalen Ressource, abhängig ist. Sollte dieser Nachteil durch die Entkoppelungsfunktion hinreichend kompensiert werden können, dann würden wir, schon um Bürokratie und Abhängigkeiten zu vermeiden, ihre Realisierung durch eine Form von peer-to-peer-System bevorzugen.[9]

Ein weiterer Grund ist, dass das (geschäftliche) Eigeninteresse entsprechender Institutionen nicht immer mit den Interessen der Nutzer harmonisieren muss.[10] Die Situation scheint sich zwar etwas gebessert zu haben, seit Registrierungsagenturen nicht mehr unbedingt eine Gebühr pro vergebener DOI verlangen. Trotzdem erscheinen uns Passagen, wie wir sie in der Policy der Registrierungsagentur für Wirtschafts- und Sozialdaten da ra finden, nicht gerade vertrauenerweckend:

Der DOI-Bezug wird von da ra für akademische Einrichtungen kostenneutral angeboten. Es kann später notwendig werden, bei da ra anfallende Kosten für den DOI-Bezug an die Publikationsagenten weiterzugeben. (da ra Policy Version 3.0, URL: www.da-ra.de/de/ueber-uns/da-ra-policy/)

Und selbst wenn eine Registrierungsagentur ihren Service für einige ihrer Kunden, etwa akademische Einrichtungen, kostenfrei anbietet: Irgendwer, und sei es am Ende der Steuerzahler, wird die Kosten tragen müssen. Wenn unsere Argumentationslinie stimmt, dass der bürokratische Aufwand im Falle der DOIs für die bloße Bereitstellung permanenter Identifikatoren unnötig groß ausfällt, dann zahlt derjenige, der die Kosten trägt, zu viel.

Dieser Ansicht sind wir auch deshalb, weil wir - anders als z.B. Hausstein und Grunow (2012, 48) - Zweifel daran haben, dass durch verbindliche Verträge zwischen einer DOI-Registrierungsagentur und ihren Klienten, d.h. den Anbietern von digitalen Publikationsdiensten oder Repositorien, eine größere Langlebigkeit erzielt werden kann. Denn einerseits liegt es ja schon im Eigeninteresse der Klienten die Langlebigkeit der Permalinks sicherzustellen, unter denen sie ihr Material anbieten. Wozu bedarf es aber noch eines Vertrages, wenn gar kein Interessenkonflikt entstehen kann?

Zum anderen würden Verträge gerade in den Situationen kein wirksames Mittel mehr darstellen, in denen die Bereitstellung permanenter Netzadressen trotz des Eigeninteresses scheitert, also etwa bei der zuvor erwähnten institutionellen Auflösung des Klienten, oder falls technische Inkompetenz auf Seiten des Klienten dazu führt, dass die hinterlegten Netzadressen ihre Gültigkeit verlieren. Da die Erzeugung permanenter Netzadressen nur einen sehr geringen technischen Aufwand verursacht, erwarten wir auch nicht, dass „daran zuerst gespart“ wird, sollte ein Publikationsdienstanbieter wirtschaftlich unter Druck geraten, so dass wir unter diesem Gesichtspunkt ebenfalls kaum eine Notwendigkeit für die explizite vertragliche Regelung mit einer Registrierungsagentur sehen.

Abgesehen davon könnte sich der Publikationsdienstanbieter statt gegenüber einer Registrierungsagentur auch ebensogut gegenüber seinen Kunden vertraglich zur Bereitstellung dauerhafter Netzadressen oder Identifikatoren verpflichten. Das würde, soweit es um eine rechtliche Sicherstellung der Dauerhaftigkeit von Identifikatoren geht, die Registrierungsagentur erübrigen. Auch unter administrativen Gesichtspunkten sehen wir daher keine prinzipiellen Vorteile von DOIs.

Trotzdem kann man beobachten, dass DOIs sich mehr und mehr durchsetzen. Wir glauben, dass es dafür mehrere Gründe gibt, und räumen ein, dass diese Gründe tatsächlich für DOIs sprechen, wenn auch im Wesentlichen nur als Folge einer selbsterfüllenden Prophezeiung.

Der wichtigste Grund dürfte der sein, dass bei DOIs inzwischen der Netzwerkeffekt greift, da sie als permanente digitale Identifikatoren mittlerweile schon so bekannt sind, dass sie manchmal geradezu als Synonym dafür verwendet werden. Eine Folge dieser Bekanntheit ist, dass in vielen bibliographischen Datensätzen bereits ein Feld für die DOI vorgesehen ist, während es meist kein explizites Feld für einen Permalink gibt, sondern lediglich ein URL-Feld, von dem zweifelhaft bleibt, ob es ausschließlich für Permalinks zu verwenden ist. (Siehe dazu den Abschnitt zur Kenntlichmachung von Permalinks weiter unten.)

Weiterhin sind DOIs - nicht zuletzt auch wegen ihrer Bekanntheit - als solche sofort erkennbar, während man Permalinks nicht unbedingt ansieht, dass sie als permanente Links gedacht sind. Werden nicht schon in der URL entsprechende symbolische Merkmale (z.B. „purl“ oder das Wort „permanent“) eingebaut sind, dann gibt ja erst die Permalinkerklärung des Herausgebers darüber Auskunft.

Schließlich hat der Abschluss eines Vertrages mit einer Registrierungsagentur selbst dann, wenn man ihn - wie wir - für verzichtbar hält, die Wirkung eines Rituals, das allen Beteiligten den Sinn der Sache wieder ins Gedächnis ruft bzw. sie zuallererst darauf aufmerksam macht. Wir denken jedoch, dass man alle diese Vorzüge, da sie nicht auf intrinsischen Eigenschaften von DOIs beruhen, auch billiger haben könnte.

In jedem Fall sind wir der Überzeugung, dass Identifikatoren wie DOI, PURL nicht mehr leisten als jeder andere Permalink und daher unserer Ansicht nach auch nicht als besser oder zitierfähiger beurteilt werden sollten. Dazu abschließend ein Zitat von Tim Berners-Lee (dem Vater des WWW):

„This is probably one of the worst side-effects of the URN discussions. Some seem to think that because there is research about namespaces which will be more persistent, that they can be as lax about dangling links as they like as "URNs will fix all that". If you are one of these folks, then allow me to disillusion you.

Most URN schemes I have seen look something like an authority ID followed by either a date and a string you choose, or just a string you choose. This looks very like an HTTP URI. In other words, if you think your organization will be capable of creating URNs which will last, then prove it by doing it now and using them for your HTTP URIs. There is nothing about HTTP which makes your URIs unstable. It is your organization. Make a database which maps document URN to current filename, and let the web server use that to actually retrieve files.“ (Berners-Lee 1998)

[8] Wir sind Klaus Graf für den Hinweis auf diesen wichtigen Punkt dankbar.

[9] So strebt das beispielsweise auch die „Permanent Identifier Community Group“ unter dem Dach des World-Wide-Web-Konsortiums an www.w3.org/community/perma-id/2013/02/16/launch/.

[10] Vgl. zu Kosten und Geschäftsmodellen etwa den Abschnitt über die „Registration Agencies“ im DOI-Handbuch (DOI-Foundation 2016). Vgl. auch den Clarin-Report zu „Persistent and Unique Identifiers“ von 2008 (Broeder et al. 2008), der das durchaus kritisch sieht.

t g+ f @