Die Extensible Markup Language in kurzen Zügen

XML steht für Extensible Markup Language und ist eine Inhaltsbeschreibungssprache für strukturierte Daten. Jede Informationseinheit wird durch ein so genanntes «Tag»(englisch für «Schildchen»oder «Etikette») identifiziert. Mit anderen Worten: In XML bringt jede Informationseinheit immer die Beschreibung ihrer selbst mit. Daher wird XML auch als Metasprache bezeichnet. Beispiel: <name>Hänsel</name>

Ein weiteres Merkmal ist die hierarchische Organisationsform der Informationseinheiten.
Ein XML-Dokument enthält Daten in aller Regel nicht als «flache» Struktur, in der die Informationseinheiten hintereinander folgen. XML organisiert Information hierarchisch: Die Bestandteile einer Datenstruktur werden durch übergeordnete Tags «geklammert», d.h. zu einem grösseren Ganzen gegliedert. Der folgende Code zeigt, wie sich Hänsel über eine entsprechende Struktur in die Märchenwelt eingliedern lässt:

<märchen>
<name>Hänsel</name>
<name>Gretel</name>
<name>Böse Hexe</name>
<ort>Dunkler Wald</ort>
</märchen>

Diese Verästelung lässt sich beliebig fortführen, wodurch Strukturen von beliebiger Tiefe entstehen können. In unserem Beispiel könnte <märchen> Teil einer <literatur>-Datenstruktur sein – und so fort.

Wer sich mit HTML auskennt, der hat beim Betrachten einer XML-Datei ein Déjà-vu: HTML und XML haben einen gemeinsamen Ursprung und daher nicht zu übersehende Ähnlichkeit. In den Möglichkeiten ist HTML auf das Beschreiben von Webseiten beschränkt, XML hingegen ist für einen universellen Einsatz ausgelegt.

Das XML-Konzept ist für die Verwendung im Internet ausgelegt; XML-Daten können nicht nur in Dateien gespeichert, sondern auch als Datenstrom per Web übertragen werden. Die Väter von XML haben auch an die Darstellung (Formatierung) der Daten gedacht und die Möglichkeit geschaffen, XML-Strukturen zu transformieren: Über eine Datei mit entsprechenden Anweisungen lassen sich die Äste des Datenbaums je nach Erfordernis neu zusammensetzen, beschränken oder mit Daten aus anderen Quellen erweitern.

Hemmschuh der proprietären Formate: Die Sohle ist weg, aber das Oberleder noch intakt

XML stellt eine Abkehr von proprietären Dateiformaten dar, die nur mittels spezieller Importfilter gelesen und geschrieben werden können. XML gilt als Vermittlersprache im Internet und gewährleistet das, was die Informatiker mit dem Wort-Ungetüm «Interoperabilität» bezeichnen: den Datenaustausch zwischen unterschiedlichen Systemen, die auf direktem Weg keine Verständigung zustande bringen. Aufgrund der breiten Unterstützung hat XML gute Chancen, die grossen Hoffnungen zu erfüllen und zur «Lingua franca» des Internet zu werden – und einen Standard für strukturierte Daten zu werden, wie wir ihn mit HTML für die Darstellung von Texten und Bildern im Internet kennen.

Quelle: Publisher, Donnerstag, 15. April 2004

Rubrik und Tags:

Faksimile

Metadaten
Thema: Prepress
Nr: 5612
Ausgabe: 04-2
Anzahl Subthemen: 4

Obsolete Datenfelder
Bilder: 1
Textlänge: 250
Ort:
Tabb: FALSCH