Word-HTML bereinigen, Teil zwei

(msc) Wer Dreamweaver nicht benützt und dennoch mit der mehr als fragwürdigen Aufgabe betraut ist, mit Word gespeicherte HTML-Seiten in brauchbaren Code umzuwandeln, hat mehrere Möglichkeiten. Zum einen bietet Microsoft selbst ein entsprechendes Tool an. Office 2000 HTML Filter entfernt einiges an Ballast. Downlad des Tools: www.microsoft.com/germany/download, dann nach «Office 2000 HTML Filter» suchen.

Auch nach der Behandlung mit diesem Tool bleiben viele unerwünschte Tags zurück, die die Bearbeitung in einem richtigen Webeditor erschweren oder sogar verunmöglichen. Eine Möglichkeit in diesem Fall ist HTML Tidy. Dieses Programm räumt HTML-Code auf und macht aus Word-Webdokumenten richtig brauchbare HTML-Seiten.

Der grosse Vorteil: HTML Tidy verschönert nicht nur das, was hinten aus Word herauskommt, sondern auch, was andere HTML-Vandalen generieren. Viele Content-Management-Systeme sind nicht eben für ihren schönen Code bekannt – wer Seiten von solcher Herkunft weiterzubearbeiten hat, dürfte mit HTML Tidy ein gutes Hilfsmittel haben. Der Nachteil: HTML Tidy ist ein Befehlszeilenprogramm, in das man sich erst einmal einarbeiten muss. Eine Kurzanleitung gibts im Artikel zu den Neuzugängen im Downloadbereich.

Eine letzte Möglichkeit bietet die Zwischenablage – und in vielen Fällen ist das der einfachste Weg. GoLive in der neuen CS-Version importiert den Inhalt der Zwischenablage nicht unformatiert, wie seine Vorgänger, sondern behält die Zeichenformate bei. Kopiert man einen Text in Word in die Zwischenablage und fügt ihn dann in GoLive in ein leeres Dokument, bleiben viele der Formatierungen bestehen. Die Word-Formate «Überschrift 1» etc. werden übrigens automatisch nach «h1» umgesetzt – mehr verlangt man bei einer Datenübernahme in aller Regel gar nicht!

Quelle: Publisher, Montag, 23. August 2004

Rubrik und Tags:

Faksimile

Metadaten
Thema: Web-Tipps
Nr: 5669
Ausgabe: 04-4
Anzahl Subthemen: 2

Obsolete Datenfelder
Bilder: 0
Textlänge: 60
Ort:
Tabb: FALSCH