Am 10. Oktober 2024 ging mein wichtigstes Archiv offline und schloss damit seine Türen für Benutzer*innen. Das mag erst einmal nicht so ungewöhnlich klingen. Alle Archive haben Öffnungszeiten und hatten in der Pandemie über Wochen und Monate geschlossen. Nicht so mein Archiv: das Internet Archive. Während alle anderen Historiker*innen klagten, konnte ich ohne Einschränkungen forschen. Man könnte sagen, ich war verwöhnt. Doch ganz so einfach ist es nicht.
Denn am 9. Oktober 2024 wurde das Internet Archive Opfer von gleich drei Hackerangriffen, die wohl nicht zuletzt durch ihr zufälliges Zusammenfallen eine enorm destruktive Wucht entfalteten. Natürlich sind auch andere Archive von Hackerangriffen betroffen, so erst im August 2024 das Archiv der DDR-Opposition der Robert-Havemann-Gesellschaft. Die Benutzung des Archivs wurde daraufhin eingeschränkt; eine Fotodatenbank ließ sich nicht mehr durchsuchen. Doch anders als das Internet Archive ist das Archiv der DDR-Opposition eben kein Internet-Archiv. Seine wohl wichtigsten Archivalien lagern in Papierform in Ordnern und säurefreien Kartons. Ihnen konnten die Hacker nichts anhaben.
Das Internet Archive dagegen beherbergt wahre digitale Schätze. Seit 1996 archivieren seine Crawler ‚das Internet‘. Ja, am liebsten das ganze World Wide Web. Denn dafür wurden die Crawler ursprünglich entwickelt – für Suchmaschinen, die das frühe Web kartieren sollten. Der Tech-Pionier Brewster Kahle zog daraus die Idee, ein mit Webseiten gefülltes Archiv zu gründen. Daraus entstand das Internet Archive, das seinen Sitz bis heute in San Francisco, Kalifornien, hat, wo es inzwischen einen klassizistischen Kirchenbau bezogen hat. Weitere Server, die das Internet Archive spiegeln, liegen bei der symbolträchtigen Bibliotheca Alexandrina in Ägypten.
Wer heute etwas über frühe Webkulturen – in meinem Fall über Formen der digitalen Auseinandersetzung mit der DDR – erfahren will, ist auf die Sammlungen des Internet Archive angewiesen. Dazu nur eines von vielen möglichen Beispielen (meine eigene Sammlung umfasst mittlerweile rund 1000 Websites): Die frühen Webseiten der BStU unter Joachim Gauck aus dem Jahr 1999 etwa lassen sich wohl nur noch dort finden. Darunter auch ein „Schwarzes Brett“ auf dem sozusagen die Fetzen flogen und das bald wieder vom Netz genommen wurde, woraufhin ein verärgerter Nutzer ein alternatives „Schwarzbuntes Brett“ gründete. Ablesen kann man hier das Ringen mit einem neuen Medium und einer neuen Erinnerungskultur.
Diese Seiten habe ich, wie so viele andere, heruntergeladen, sodass ich manches noch ansehen konnte, als die Wayback Machine (ein Tool des Internet Archive, mit dem sich die archivierten Webseiten anzeigen lassen) am 9. Oktober erst zunehmend stockend lief, um dann am 10. Oktober gegen Mittag ganz offline zu gehen. Natürlich habe ich nicht alles heruntergeladen. Denn digitale Archive verändern das Arbeiten. Ich habe meine Arbeitsweise über Jahre daran angepasst, dass ich meine Quellen zu jeder Tages- und Nachtzeit gewissermaßen ‚im Original‘ gegenprüfen kann (auch wenn es sich streng genommen nicht um Originale, sondern um sogenannte „digitale Wiedergeburten“ handelt).[1] Und so suchte ich am 9. und 10. Oktober mit zunehmender Unruhe den Fehler zuerst bei eduroam, später bei meiner überfüllten Festplatte und erst sehr viel später beim Internet Archive selbst. Schließlich stieß ich in der IT-Fachpresse und auf X auf Nachrichten und las mit Erschrecken von den Hackerangriffen.
Auf X fanden sich dazu Kommentare, deren Verfasser*innen sich bestürzt fragten, warum um alles in der Welt jemand das Internet Archive angreifen sollte. Wer macht so etwas? Ging es um Prestige oder lag den Angriffen doch ein konkretes Motiv zugrunde? Eigentlich sollte man meinen, dass die „universal access“-Philosophie von Internet-Archive-Gründer Brewster Kahle Hackern zusagen müsste. Eine der drei Hackergruppen hat ein eindeutig antisemitisches Weltbild zu erkennen gegeben. Wieso sie das Internet Archive angriff, bleibt dennoch unklar. Falls es sich um bloße Zerstörungswut gehandelt haben sollte, sind die Hacker glücklicherweise gescheitert: Wie Brewster Kahle noch am 10. Oktober auf X versicherte, wurden die Daten nicht beschädigt.
Und doch wirken sich die Angriffe auf die Bestände aus, auch wenn zunächst offenbleiben muss, in welchem Ausmaß nun Lücken entstanden sind – und weiterhin entstehen. Zwar ging die Wayback Machine am 14. Oktober nach vier Tagen wieder online. Doch selbst, wenn sie ab dem 15. Oktober mit 1.500 Requests pro Sekunde wieder mit voller Kraft arbeitete, blieben manche Funktionen zunächst eingeschränkt. Die Save Page Now-Funktion ist noch immer deaktiviert. Sie erlaubt es Nutzer*innen eigentlich, eine URL einzugeben und einen Crawl der entsprechenden Webseite auszulösen. Dieser Service ist nun vorerst abgeschaltet.
Für Nutzer*innen ist es damit bis auf Weiteres nicht möglich, händisch Webseiten zu den Beständen des Internet Archive hinzuzufügen und sie so gleichsam zu archivieren. Dazu kommt die Frage, inwiefern die Crawler womöglich von den Angriffen betroffen waren. Ein erster Blick ins Archiv zeigt, dass selbst die Startseite der New York Times, die die Crawler normalerweise mehrere Male am Tag erfassen, seit dem 10. Oktober nicht mehr archiviert wurde.
So bleibt vorerst nur zu hoffen, dass die Crawler im Hintergrund weiterarbeiten und die Dateien lediglich später eingespeist werden. Wenn nicht, hätten die Hacker ein schwarzes Loch in die Webgeschichte gehauen.
Am 10. Oktober wurde für mich ein persönlicher Albtraum wahr. Was mich vorerst beruhigt, ist, wie zuverlässig Brewster Kahle Updates über den Stand der Dinge auf X veröffentlichte („Estimated Timeline: days, not weeks. Thank you for the offers of pizza (we are set).“) und wie intensiv sich das Internet-Archive-Team offenbar bemühte, die Wayback Machine schnell wieder online zu bekommen. Abgesehen davon, was aus X inzwischen geworden ist, beruhigte mich auch die große Resonanz unter X-Usern ein wenig. Die vielen Nachfragen und Hilfsangebote, die in den Kommentaren zu den Posts des Internet Archive zu lesen sind, lassen erkennen, dass die Bedeutung des Internet Archive durchaus erkannt wird.
Und doch bleibt, wie so oft nach einem Albtraum, eine unterschwellige Unruhe zurück. Dazu trägt sicherlich bei, dass schon vor den Hackerangriffen in großem Stil gegen das Internet Archive vorgegangen wurde, wenn auch auf juristischem Wege. Schon 2020 verklagten vier Verlagshäuser das Internet Archive wegen angeblicher Urheberrechtsverletzungen und bekamen vor Gericht recht. Im Jahr 2023 zogen mit Universal, Sony und Concord drei Schwergewichte der Musikindustrie mit einer Urheberrechtsklage nach. Die geforderte Summe beträgt 621 Millionen Dollar, das Urteil steht noch aus. Dies ist ein bislang einmaliges Vorgehen gegen ein Archiv. Aber das Internet Archive ist eben auch ein ganz besonderes Archiv.
Die Gefahr besteht darin, dass die Copyright-Streitigkeiten das Internet Archive früher oder später vor existenzielle Probleme stellen könnten. Manchmal wünschte ich, dass sich das Internet Archive auf seinen eigentlichen Schatz – die Abermilliarden Webseiten, die in absehbarer Zeit wohl auch für die Zeitgeschichte von zentralem Interesse sein werden – zurückbesinnen oder gar auf diesen beschränken würde.[2] Doch würde Brewster Kahle nicht zu größeren Visionen neigen, hätte er das Internet Archive womöglich nie gegründet.
Vielleicht sind es also andere, die realistisch sein müssen. Vielleicht besteht die eigentliche Frage vielmehr darin, was bestehende Institutionen und Einrichtungen dafür tun können, dieses digitale Kulturerbe effektiver zu sichern und zu bewahren. Gerade mit Blick auf die 90er und 2000er Jahre wäre die Situation für die Zeitgeschichte ohne das Internet Archive regelrecht prekär.
[1] Andreas Fickers, Update für die Hermeneutik. Geschichtswissenschaft auf dem Weg zur digitalen Forensik?, Zeithistorische Forschungen 17 (2020), S. 157–168, hier S. 166.
[2] Mit einer ähnlichen Überlegung meldete sich in Folge des Hackerangriffs auch Tilman Baumgärtel auf Zeit Online zu Wort. Tilman Baumgärtel, Bücher werden überall gesammelt, Websites nur hier, 17.10.2024, letzter Abruf am 22.10.2024.