HTML-Dateien entrümpeln

(msc) HTML-trimmen.vbs ist ein Script für Windows, das wir für den internen Gebrauch entwickelt haben, nun aber auch unseren Lesern zur Verfügung stellen. Es bereinigt HTML-Seiten. Es entfernt am Anfang und am Ende Code, und zwar automatisiert, bei allen HTML-Dateien, die sich im angegebenen Ordner befinden.

Wozu? Dieses Script ist nützlich, wenn man eine statische Website in eine dynamische oder per CMS verwaltete Site überführen möchte. Bei einer statischen HTML-Seite steckt der Inhalt der Seite gewöhnlich im Sandwich: Am Anfang der Seite finden sich die Header-Informationen mit verknüpften Stildateien, die Navigation und andere Angaben. Am Ende ist ein «Footer» zu finden, d.h. Fusszeile und abschlies­sende Informationen. Dazwischen steckt der eigentliche Inhalt der Seite.

Bei einer dynamischen Site wird die Seite aus den Einzelelementen zusammengepuzzelt, Header und Footer, Formatierungsinformationen etc. werden per PHP oder auf anderem Weg mit dem Inhalt verbunden. Entsprechend braucht man in den einzelnen Seiten nur den Inhalt – der Header, die Navigation und der Footer werden dynamisch erzeugt und müssen weg.

Und dabei hilft unser Script. Es löscht alle Informationen am Anfang und am Ende, sodass am Schluss nur der eigentliche Inhalt erhalten bleibt. Damit das klappt, müssen Anfang und Ende aber eindeutig zu identifizieren sein. Dabei könnten beispielsweise div-Tag, die den eigentlichen Inhalt oder den Fussbereich eindeutig kennzeichnen, hilfreich sein. Bei unserem Script bleibt der Inhalt erhalten, der im div-Container «mainbox» steckt – alles, was davor in der HTML-Datei steht, wird herausgelöscht. Der Footer wird ebenfalls entfernt. Er wird anhand des div-Containers durch «Bottombox» ermittelt.

Das Script nutzen Sie einfach: Öffnen Sie es in einem Texteditor und passen Sie die Parameter am Anfang an – was sie bewirken, ist im Script selbst dokumentiert. Dann führen Sie das Script aus und geben den Ordner an, in dem die zu bearbeitenden HTML-Dateien zu finden sind.

[Win] > Webtools > HTML-trimmen.vbs, 4KB

Quelle: Publisher, Mittwoch, 9. April 2008

Rubrik und Tags:

Faksimile

Metadaten
Thema: Online
Nr: 8217
Ausgabe: 08-2
Anzahl Subthemen: 12

Obsolete Datenfelder
Bilder: 0
Textlänge: 79
Ort:
Tabb: FALSCH