![]() |
|||
| HSG |
|
Wir sind es gewohnt, mit Textmarkern gewisse Textabschnitte zu markieren. Dabei können verschiedene Farben auch verschiedene Bedeutungen haben. So z.B. in folgendem Ausschnitt aus dem Märchen 'Rapunzel' (Quelle: Projekt Gutenberg).

Man sieht, dass eine Markierung einen gewissen Textteil markiert. Dieser Teil hat einen Anfang und ein Ende. Weniger farbig, dafür aber besser mit einem Computer zu verarbeiten, könnte man auch so vorgehen:
<Überschrift>Rapunzel</Überschrift> <Absatz>Es war einmal ein Mann und eine Frau, die wünschten sich schon lange vergeblich ein Kind, ...</Absatz> <Absatz>Rapunzel ward das schönste Kind unter der Sonne. ... Wenn die Zauberin hinein wollte, so stellte sie sich unten hin und rief:</Absatz> <Absatz>»Rapunzel, Rapunzel, Laß mir dein Haar herunter!«</Absatz> <Absatz>...</Absatz>
Das ist genau der Ansatz von XML, der 'Extensible Markup Language'. 'Erweiterbar' (extensible) heißt, dass man die Sprache selbst erweitern kann. Man sieht, dass die 'Auszeichner', engl. 'tags', z.B.
<Überschrift> </Überschrift>
Anfang und Ende eines Text-Teils markieren. Die spitzen Klammern haben also die Sonderbedeutung, Anfang und Ende der 'tags' zu kennzeichnen. Wenn man die Regeln der Wohlgeformtheit einhält und durch die Dateiendung 'xml' anzeigt, dass es sich um ein xml-Dokument handelt, zeigt ein moderner Browser, wie etwa 'firefox' das Dokument rapunzel.xml
<?xml version="1.0" encoding="UTF-8" ?> <meinText> <Überschrift>Rapunzel</Überschrift> <Absatz>Es war einmal ein Mann und eine Frau, die wünschten sich schon lange vergeblich ein Kind, ...</Absatz> <Absatz>Rapunzel ward das schönste Kind unter der Sonne. ... Wenn die Zauberin hinein wollte, so stellte sie sich unten hin und rief:</Absatz> <Absatz>»Rapunzel, Rapunzel, Laß mir dein Haar herunter!«</Absatz> <Absatz>...</Absatz> </meinText>
in einer besonderen Ansicht, der Baum-Ansicht an. Dabei werden Verstöße gegen die Wohlgeformtheit als Fehler gekennzeichnet und die weitere Anzeige des Dokuments abgebrochen, so etwa in rapunzel0.xml. Was wurde da falsch gemacht?
