[linux-l] LaTeX vg. XML

Peter Ross Peter.Ross at alumni.tu-berlin.de
Di Feb 4 03:13:44 CET 2003


Hi Olaf,

auch wenn ich als SysAdmin nicht 100% sattelfest bin, hier ein Versuch,
das erklaerbar zu machen. Uebrigens tut ein Blick auf den aelteren Bruder,
SGML, und EDIFACT, z.B. in der Autoindustrie seit Jahr(zehnt?)en im
Einsatz, nicht weh.

Ich habe in paar Jahre in einer Firma gearbeitet, die u.a.
Fernsehprogramme sammelt, in eine Datenbank tut, sie wieder rausholt,
formatiert und an die Tageszeitungen schickt.

Ich bin beim Eingang ueberhaupt nicht daran interessiert, es zu lesen, ich
will es speichern. So lange ich das parsen kann, ist schoen (sonst muss
ich es abtippen), obs blau oder gruen, fett oder kursiv da steht,
interessiert mich ueberhaupt nicht.

Deshalb brauche ich eine Beschreibungssprache - XML z.B.

Wenn ich es an die Zeitung schicke, soll alles schoen aussehen und ezakt
auf die Seite passen - ein Layout eben. Das kann z.B. ein TeX-File sein,
was sehr schoen aussieht (die Praxis heisst meist QuarkXpress).

Nun bekomme ich den ganzen Kram mal als Word-Datei, mal als PDF, mal als
RTF, mal als LaTeX.. Prima..

Okay, also neuerdings als XML. Just another standard?

Nein, es kommt etwas anderes..

Bis jetzt musste ich fuer jeden Sender rausbekommen, wie er etwas setzt.
Der Titel der Sendung wird fettgedruckt - okay, parse nach Fettdruck. Die
Urzeit vorne - okay, habe ich. Naechste Woche anderer Tipper - andere
Schrift..

Stattdessen nun:

<REGIE>Hitchcock</REGIE><SENDUNG>39
Stufen</SENDUNG><DREHJAHR>19xx</DREHJAHR>

Nun, das bekomme ich doch viel besser in die Datenbank..

Und damit nicht naechste Woche <REGISSEUR> statt <REGIE> kommt, gibt es
TNT, nein, DTD (pardon, aber ich bekomme gerade in Bezufg auf XML ein
bisschen Abkuerzungsallergie - es sind so viele), die sagt, welche Tags
vorkommen duerfen.

Auf die einigt man sich, am besten mit allen Fernsehsendern.

Was hat der Sender davon? Okay, gedruckt werden konnte er auch vorher
schon, was geht ihn das an?

Tja, er ist in der Lage, zum Beispiel schnell eine WWW-Seite zu erzeugen,
mit einer Beschreibung, die sagt, <ZEIT> vorn, <SENDUNG> dahinter und
fett, <REGIE> blau.

Das einem XML-faehigen Browser mitgeteilt bzw. in HTML umgewandelt (vom
Server) und fertig ist die Webseite.

Das ist doch was anderes als das Satzsystem LaTeX..

Und wenn Du Platz sparen willst, nimmst Du gzip und oeffnest mit zcat;-)

Gruss
Peter
der XML-Laie




Mehr Informationen über die Mailingliste linux-l