[ Fenster schließen ] - [ Drucken ]

XML für Einsteiger

Hier biete ich einen kleinen Vorgeschmack auf meinen Titel XML für Einsteiger. Wenn nach dem Lesen der Einleitung das Gefühl bleibt, dass es sich um einen ganz simplen Titel handelt, ist das ein Irrtum! Zugegeben, es handelt sich um einen Einsteigertext, ein didaktisch aufgebautes Kursmaterial. Auch Nicht-Eingeweihte sollen das Thema in kurzer Zeit erfassen können.

Nach der hier veröffentlichten allgemeinen Einleitung geht es aber bald in die Tiefe.

Der Titel enthält Beispiele und viele Übungen!

Folgende Themen werden behandelt:

Und nun viel Spaß beim Lesen der ersten drei Seiten!

So fing alles an: SGML als Dokumentbeschreibungssprache

Vielfalt macht krank! Vielleicht kennst du das Drama auch: Du bekommst einen Text von einem Bekannten und ... kannst ihn nicht öffnen. Der Grund: Der Bekannte benutzt eine andere Textverarbeitung als du und es gibt keinen Filter. Doch selbst wenn du die gleiche Textverarbeitung verwenden würdest, wäre der Erfolg noch nicht garantiert. Angenommen dein Bekannter benutzt einer neuere Version? Auch dann sieht es schlecht aus, denn dein Programm kennt das Format der neueren Version nicht.

Der Turmbau von Babel

Und tatsächlich geht es bei der Computerei oft zu wie beim Turmbau von Babel. Jeder Hersteller nutzt für seine Programme sein eigenes Format und alle paar Jahre ändert er dieses.

Und selbst die raffiniertesten Filter schaffen es nicht immer, alle Eigenschaften verlustfrei von einem Format ins andere zu transferieren.

Was machst du, wenn du in zehn Jahren die Dokumente ansehen möchtest, die du damalst verfasst hast? Ob das so einwandfrei klappt? Einverstanden, bei Privatkorrespondenz mag das weniger tragisch sein, doch was passiert mit wichtigen Dokumenten von Behörden und Institutionen?

Dieses Problem ist nicht neu, sondern zeichnete sich schon vor Jahrzehnten ab. Deshalb befasste sich schon in den siebziger Jahren ein gewisser Professor Charles F. Goldfab im Auftrag von IBM mit der Dokumentbeschreibung. Heraus kam die so genannte GML, die Generalized Markup Language.

Ziel der GML war es, Dokumente so zu beschreiben, dass das Ergebnis weder von einer bestimmten Plattform noch von einem spezifischen Anwendung abhing. Es ging nicht um das Aussehen eines Dokumentes, sondern um die logische Struktur wie die Einteilung in Überschriften, Kapitel, Seiten, Abschnitte.

SGML wird zum ISO-Standard

GML wurde im Laufe der Jahre weiterentwickelt. Heraus kam SGML. SGML steht als Abkürzung für Standardized Generalized Markup Language, zu deutsch "allgemeine, standardisierte Sprache zur Textauszeichnung".

Die Entwicklungen gingen so weit, dass SGML 1986 als internationaler Standard anerkannt werden konnte, als ISO 8879.

Wichtig zu wissen: SGML speichert nicht das Layout, sondern die logische Struktur von Dokumenten. Ziel von SGML war es tatsächlich, wichtige Dokumente unabhängig von ständig wechselnden binären Dateiformaten (Word, WordPerfect) oder Betriebssystemen (Windows, Mac-OS, Unix usw.) dauerhaft elektronisch sichern zu können. Behörden, Firmen, Bildungseinrichtungen und Institutionen speichern Dokumente in SGML.

Ein Bekannter von mir schwärmte noch vor Jahren, dass nun alle wichtigen wissenschaftlichen Arbeiten in SGML gesichert würden. Er arbeitete als Assistent an einer Berliner Universität. Er war wahrscheinlich einer der wenigen, die damals schwärmten. Die meisten kannten SGML überhaupt nicht, trotz seiner offenbar überragenden Vorteile. Oder war da noch was?

SGML ist kompliziert!

SGML hatte einen entscheidenden Schönheitsfehler: Es war zu kompliziert. Man hatte bei der Entwicklung an Verwaltungen und Behörden und nicht an "Otto Normaltexter" gedacht. Demzufolge waren die Software-Werkzeuge zum Erstellen von SGML teuer und nicht sehr weit verbreitet.

Und so wundert es kaum, dass SGML außerhalb der schon erwähnten Einrichtungen kaum Verbreitung fand. Doch dann kam das World Wide Web und die Welt veränderte sich ...

HTML als Dokumentbeschreibungssprache für das Web

Was war 1989/90? Richtig, der Mauerfall, die Wende. Doch darauf wollte ich gar nicht hinaus. Das World Wide Web wurde erfunden! Und zwar nicht von Honecker, Gorbatschow oder Helmut Kohl, sondern von Tim Berners-Lee in der neutralen Schweiz. Dieser Mensch arbeitete als Informatiker an einem Kernforschungszentrum bei CERN.

WWW: Das Internet wird grafisch

Was die Meisten vergessen: Das Internet gab es zu der Zeit schon längst. Schließlich gehen die Ursprünge dieses Netzwerks bis in die 60er Jahre zurück! Die ersten E-Mails schickte man sich schon 1971 in den USA, beliebte Dienste im später weltweit operierenden so genannten "Internet" wurden neben E-Mail auch das Usenet (Diskussionsforen), der Dateidownload mit FTP, die Dateisuche mit Archie oder die WAIS-Datenbankrecherche.

Doch die Bedienung des Internets war ein Graus: Es handelte sich um einen durch und durch elitären Verbund für elitäre Menschen wie Militärs, Wissenschaftler und Universitäts-Mitarbeiter, und selbst die schafften es nicht immer. Um Informationen abzurufen, musste man erst kryptische Befehle lernen und sich die Finger auf der Tastatur wund hämmern. Wer DOS kennt oder schon einmal mit reinen Unix-Rechnern zu tun hatte, weiß, was ich meine. Eine grafische Benutzeroberfläche gab es damals nicht.

Nichts für Otto Normalverbraucher also, ganz abgesehen davon, dass du oder ich zu dieser Zeit sowieso noch keinen Zugang bekommen hätten. Ich glaube, dass die meisten noch nicht einmal etwas von der Existenz des Internets wussten. Das änderte sich spätestens mit der Erfindung von Tim-Berners Lee. Sie hieß: World Wide Web. Grundlage war eine Dokumentbe-schrei-bungs-spra-che namens HTML.

Mit dem World Wide Web kamen zum ersten Mal die bunten, anklickbaren Seiten. Es kam das, was man landläufig auch als Homepage bezeichnet. Eine "Homepage" oder besser "Webseite" ist nichts weiter als ein Dokument mit Text, Querverweisen und Grafiken. Dieses Dokument oder vielmehr diese Dokumente liegen auf den Webservern im World Wide Web. Anschauen kann man sich das Ganze mit Hilfe eines Browsers. Das ist ein Anzeigeprogramm, welches man auf seinem heimischen Rechner installiert.

Die heute bekanntesten Browser heißen Internet Explorer, Netscape Navigator und Opera. Zum Transport der Daten vom Webserver zum Browser dient ein Protokoll namens HTTP, Hypertext Transfer Protocol. (Deshalb also das http:// vor jeder Web-Adresse!)

Betrachte den Internet-Dienst World Wide Web ruhig als eine Art "grafische Oberfläche" für das Internet. Alles ist intuitiv bedienbar mit der Maus. HTML als Sprache für Webseiten

Nun haben wir die ganze Zeit über diese Dokumente geredet, interessant ist vor allem die Sprache, in der sie verfasst sind. Reden wir über HTML, die Hypertext Markup Language.

Lee war nicht dumm und hat das Rad natürlich nicht neu erfunden. Er besann sich auf vorhan-de-ne Standards.Webseiten im HTML-Format sind eine Kombination von:

ASCII ist sicher bekannt, die Abkürzung steht für American Standard Code for Information Interchange. Es handelt sich um ein standardisiertes, reines Textformat. ASCII ist praktisch der "kleinste gemeinsame Nenner" beim Datenaustausch zwischen Rechnern. Jedes einfache Schreibprogramm kann ASCII speichern bzw. lesen.

Ältere Computerhasen kennen ASCII vielleicht noch unter der Bezeichnung MS-DOS-Text.

[ Fenster schließen ] - [ Drucken ]