Rettet eure Daten! Das digitale Vergessen

0 Kommentare

Während uns Datenschützer davor warnen, private Daten könnten leicht gestohlen werden, übersehen wir ein ganz anderes Problem: Die meisten unserer Fotos, Videos und Mails werden in wenigen Jahren für immer verloren sein.

In Emmendingen, nicht weit von Freiburg, steht das Deutsche Tagebucharchiv. Die rund 13 000 Tagebücher, Lebenserinnerungen und Briefe, die dort lagern, sind das umfassendste Archiv privater Lebenserinnerungen des Landes. Neben großartig banalen Sätzen wie „Ich weiß nicht wie es kommt, aber ich habe mich in Bernd verliebt“ sind dort genauso Geschichten von Vertreibung, Umsturz und Mentalitätswandel zu finden.
Heute werden persönliche Erinnerungen eher abgespeichert als zu Papier gebracht. Tumblr-Blogs, Facebook-Posts und Flickr sind für Millionen die Medien ihrer Wahl, wenn es darum geht, etwas festzuhalten. Diese in Echtzeit produzierten Daten müssten so ausgiebig wie authentisch davon Zeugnis ablegen, wie es sich heute so geliebt und gehasst hat. Das Internet vergisst schließlich nie, rufen uns nicht nur Datenschützer so verheißungsvoll wie drohend hinterher.
Genau das Gegenteil ist der Fall, meint Paul Klimpel, der gerade ein Buch zum Thema „Digitale Langzeitarchivierung“ herausgegeben hat. Hinter der sperrigen Formulierung verbirgt sich für ihn die Frage, „ob wir im Rückblick eine Art dunkles Zeitalter erleben, aus dem es nur sehr wenige Überlieferungen geben wird“. Klimpel hat Beispiele. Urlaubsfotos sind eines davon: „Fragen Sie einmal jemanden, wo denn seine Urlaubsfotos von vor drei Jahren sind, die damals mit dem Handy gemacht wurden“, sagt Klimpel. Und fügt triumphierend hinzu: „Die Antwort ist meistens ein Kratzen am Kopf.“ Das liegt daran, sagt der Jurist, dass bei digitalen Daten aktives Handeln nötig sei, um sie durch fortwährendes Kopieren zu bewahren, während man bei analogen Datenträgern wie Negativen oder Briefpapier aktiv eingreifen muss, um sie zu zerstören.
Ob es so schlimm ist, wenn es in 40 Jahren nicht mehr möglich ist, seinen Enkeln Bilder sonnenverbrannter Urlauber am Strand in Beamershows aufzuzwingen, kann man da einwenden. Die Bedenken des Spezialisten für digitales Urheberrecht bei iRights gehen jedoch weiter als das. Bevor sich Klimpel mit digitalem Erbe beschäftigt hat, war er Verwaltungsdirektor bei der Deutschen Kinemathek. Er hat erfahren müssen, dass die ersten Jahre neuer Medien mehrfach verloren gingen. Weite Teile der Anfänge des Radios seien genauso verschollen wie frühe Filme und Fernsehsendungen: „Wann immer eine neue Technik aufkommt, steht zunächst die Begeisterung für diese Technik und deren Verwertbarkeit im Vordergrund.“ Darüber, wie man die neuen Kulturgüter bewahren könnte, mache sich kaum jemand Gedanken. Ein Problem, das in Bezug auf die Digitalisierung ungleich schwerer wiegt. Denn die beschränkt sich nicht auf einen Kulturbereich, sondern auf ein Universum von Online-Kochbüchern, über Youtube-Videos bis hin zu Softwareentwicklung.

Klassische Archive sind selten zuständig

Für nichts davon ist eines der traditionellen Archive zuständig. Das Problem der digitalen Konservierung stellt sich aber auch dort. Deswegen haben sich mehrere Museen, Archive und Firmen zum Kompetenznetzwerk „nestor“ zusammengeschlossen. Die Deutsche Nationalbibliothek – gesetzlich verpflichtet zur Bewahrung von Text und Ton, der in Deutschland produziert wird – ist bislang die einzige Institution, die eine volle Stelle für das Netzwerk finanziert. Es ist der Arbeitsplatz von Armin Straube. Er erklärt die besonderen Herausforderungen beim Archivieren digitaler Objekte: „Das Problem ist, dass sich die Software- und Hardwareumgebung ständig wandelt“. Ein Word-Dokument von heute lässt sich in 20 Jahren wahrscheinlich nicht mehr so einfach öffnen. Dasselbe gilt für eBooks, Lernprogramme oder Musik. Lösungen gibt es für das Problem grundsätzlich zwei: Die Migration oder die Emulation. Im ersten Fall wird die Datei in ein Format umgewandelt, das auch morgen noch lesbar ist. Bei der Emulation hingegen wird die Umgebung der Datei simuliert, also Betriebssystem und teilweise der Computertyp, der zu der Zeit benutzt wurde. Das bedeutet aber auch, dass man sich nicht nur entscheiden muss, welche Daten erhalten bleiben, sondern auch was von den Dateien erhalten bleiben soll. Wenn es um „Look and Feel“ geht, wie Straube es nennt, also darum, wie genau der Text einmal aussah, dann ist ein besonderes PDF-Format am sinnvollsten.


Seit 2006 hat die Deutsche Nationalbibliothek auch den Auftrag, digitale Texte und Musik zu archivieren. Das tut sie unter anderem durch Web Harvesting. Dahinter verbirgt sich, dass zu bestimmten Themen Programme losgeschickt werden, die Websites abspeichern, auf denen das Thema vorkommt. Verfügbar für Forscher sind diese Daten noch nicht. In den USA ist man da weiter. Die Library of Congress speichert alle Twitternachrichten, die gesendet werden. Ihr Archiv umfasst bislang 170 Milliarden Tweets. Sie hat mittlerweile über 400 Forschungsanfragen aus verschiedensten Ländern bekommen.

Zur Startseite