Matthias Schüssler

Surfen

Die Kunst, Internetseiten zu archivieren

Ich habe aus dem Internet verschiedene Webpages runtergeladen und als HTML gespeichert. Wenn ich mir die Seiten am Compi wieder anschauen möchte, geht es sehr lange, bis sie erscheinen. Es kommt auch oft zu Fehlermeldungen. Zum Beispiel heisst es, es sei ein Fehler im Script aufgetreten. Müsste ich den Internet-Explorer auf seinen Urzustand zurücksetzen? Was habe ich wie falsch gemacht? Ihr Rat täte meinen Nerven gut.

Peter Klein, Kilchberg

Wer ernsthaft im Internet recherchiert, macht es sich zur Gewohnheit, wichtige Informationen lokal abzulegen. Jeder «Knowledge Worker» hat es schon einmal erlebt, wie Seiten gänzlich unzeremoniell aus dem Web verschwanden und wichtige Informationen nicht mehr greifbar waren. In solchen Fällen hilft mit etwas Glück der Google-Cache weiter. In den Suchresultaten erscheint hinter der Adresse ein Dreiecksymbol, über das der Befehl «Im Cache» eine bei Google zwischengespeicherte Fassung anzeigt. Manchmal lässt sich die Seite auch über Archive.org aufspüren.

Zuverlässiger ist es auf jeden Fall, die Informationen selbst abzulegen – sei es als Ausdruck oder über einen Dienst wie Evernote.com, der mit dem «Webclipper» Informationen automatisch ins digitale Notizbuch überträgt. Man kann die Seite auch via «Ctrl» + «s» vom Browser speichern lassen, was der Fragesteller regelmässig tut.

Dabei treten häufig die beschriebenen Probleme auf. Websites sind heute nur noch selten statische Dokumente, die ohne weiteres archiviert werden können. Die Seiten werden vom Server dynamisch generiert und integrieren Inhalte aus diversen Quellen, zum Beispiel Werbung oder eingebettete Elemente zum Beispiel von Youtube, Facebook, Soundcloud oder von anderen Diensten. Inhalte werden direkt über Scripte generiert oder manipuliert, und es gibt viele Sites, die auf komplexen Anwendungen auf dem Server basieren. Diese Seiten funktionieren nach der lokalen Speicherung nicht oder nur teilweise, weil die ursprüngliche Serverumgebung fehlt.

Mit anderen Worten: Bei der Methode sind Probleme mit fehlenden Inhalten, Scriptfehlern oder anderen unliebsamen Effekten unvermeidlich. Minimieren lassen sie sich wie folgt:

  • Speichern Sie die Seiten nicht als HTML, sondern als PDF. Die PDF-Datei entspricht einem virtuellen Ausdruck in Dateiform und stellt eine Momentaufnahme der Website dar. Beim Mac finden Sie eine PDF-Speicheroption im Druckdialog. Bei Windows müssen Sie einen virtuellen Drucker installieren, der die Druckausgabe in eine PDF-Datei umleitet. Verwenden Sie zu diesem Zweck Do PDF (Dopdf.com) oder Free PDF (Freepdfxp.de). Beide Programme sind gratis. Es existieren auch Brow­ser-Erweiterungen, beispielsweise Save as PDF für Chrome oder Print pages to Pdf für Firefox.
  • Die Erweiterung «Mozilla Archive Format» (MAFF) für Firefox versucht, Seiten so aufzubereiten, dass sie lokal ohne Fehlermeldungen und andere lästige Begleiterscheinungen benutzbar sind. Sie können mit dieser Erweiterung auch mehrere offene Seiten in einer einzigen Datei speichern.

Quelle: Tages-Anzeiger, Montag, 18. August 2014

Rubrik und Tags:

Faksimile
140818 Seite 28.pdf

Die Faksimile-Dateien stehen nur bei Artikeln zur Verfügung, die vor mindestens 15 Jahren erschienen sind.

Metadaten
Thema: Kummerbox
Nr: 11804
Ausgabe:
Anzahl Subthemen: 2

Obsolete Datenfelder
Bilder: 0
Textlänge: 160
Ort:
Tabb: WAHR