[linux-l] LaTeX vg. XML

Steffen Dettmer steffen at dett.de
Mo Feb 3 21:31:55 CET 2003


* Olaf Radicke wrote on Mon, Feb 03, 2003 at 19:32 +0100:
> 1.) Habe ich mit XML eine höhere Nettobelastung,
> weil bei der Form des Datenaustausch es mehr Code
> durch die Gegend geschickt werden muss.

... als wenn man es binär machen würde. Korrekt. Binär ist
entweder DER/BER TLV, unhandlicher als XML und nicht
menschenlesbar, aber effizienter. Binärcodes, die man in der
Praxis findet, sind meistens aber propritär. Bei XML ist meistens
die DTD/das Schema offen, so das man erkennen kann, was da wie
übertragen wird.

(DER TLV: Distingusihed Encoding Rules, Tag Level Value)

> 2.) Dauert die Abfrage länger, weil XML
> Dateien erst entpackt werden müssen, um
> in ihnen Übereinstimmungen zu suchen.
> (oder sie müssen Platzfressend unkompriebiert
> gespeichert werden)

Yep, XML erfordert in der Praxis eigentlich immer Umformungen,
weil man eigentlich nie direkt mit dem Kram arbeitet. 

> 3.) Belastet XML die beiden Arbeitsspeicher
> mehr, weil die Dateien bei gleichen Informationsgehalt
> größer sind als TeX.

XML ist redundant, korrekt. Im Vergleich zu DER TLV sogar oft
enorm redundant. Bei DER braucht man bei 200 möglichen Tags ein
Byte, bei XML hat man ja mindestens zwei/drei ("</>"), plus dem
Namen, der dann auch oft sehr lang ist ("<blockquote>" z.B.).

> 4.) So wie ich es verstanden habe, gibt
> es kein XML-Standard.

Doch, den gibt es. Der sagt AFAIK im Westenlichen aus, das ein
Tag mit "<" und ">" abgeschlossen ist, das es ein Ende-Tag mit
"/" geben muß, das es Entities gibt und das wars in etwa.

Damit kann man erstmal genausoviel anfangen, wie mit ISO DER/BER
TLV - nämlich nix. Man muß zusätzlich vereinbaren, was
"<blockquote>" oder Tag 0x23 nun bedeutet, ob es ein
zusammengesetzes oder atomares ist etc. Hier setzt also ne
weitere Spec auf, und die sind nun natürlich teils auch wieder
propritär (Es gibt keinen Industriestandard für MP3 IDv3 Tag
exports und sowas). Also denkt man sich was aus.

IMHO hat XML gegenüber DER den Vorteil, daß über DTD/Schemas eine
Standardisierte Syntaxbeschreibung verfügbar ist (ASN.1 für
DER/BER ist zwar auch da, aber nicht einfach zu verarbeiten und
so). Die anderen 99% der Gründe sind vermutlich Hype...

oki,

Steffen

-- 
Dieses Schreiben wurde maschinell erstellt,
es trägt daher weder Unterschrift noch Siegel.




Mehr Informationen über die Mailingliste linux-l