XML (eXtensible Markup Language) ist ein textbasierter (text-based) Standard für die Datenbeschreibung und -struktur.
Im Rahmen der Dokumente verarbeitet der Computer zwei Dateitypen, Binärdateien und Textdateien.
Der Hauptnachteil von Binärdateien besteht darin, dass sie proprietär sind, d.h. nur von dem Anwenderprogramm gelesen und interptretiert werden können, mit dem sie erstellt wurden.
Andererseits besteht der Nachteil von Textdateien darin, dass die Formatierung des Textes nicht möglich ist, wie zum Beispiel die Anwendung von Fettschrift oder die Einfügung einer Bilddatei (Informationen namens Metadaten).
XML vereint in sich die Vorteile von Binär- und Textdateien: Einerseits können formatierte Contents (rich text) und andererseits ein Format gesichert werden, dass von jeder beliebigen Anwendung gelesen gelesen werden kann (universell austauschbar).
Aus diesem Grund wird XML als die Universalsprache par excellence bezeichnet.
Der erste Versuch, eine derartige Sprache zu erschaffen, war SGML (Standard Generalized Markup Language) im Jahr 1960, von der XML nichts weiter als eine Vereinfachung ist.
Weitere Vorteile bei der Nutzung von XML:
Die Syntax einer XML-Datei ist recht einfach:
<angestellt>
<vorname>Wolfgang</vorname>
<nachname>Schmidt</nachname>
</angestellt >
Aus diesem Beispiel ist ersichtlich, dass die Struktur einer XML-Datei aus drei Elementen besteht:
Einer der interessantesten Aspekte dieser Sprache ist die Möglichkeit, abgeleitete Sprachen für das Management beliebiger Datentypen zu schaffen, wie zum Beispiel das XLIFF-Format, das die „Markierung“ aller in einem zu übersetzenden Dokument enthaltenen Elemente gestattet, die anschließend mit einem Editor verarbeitet werden, der dieses Format unterstützt.