[linux-l] WikiDok: Trennung von Inhalt und Form (was: Dateisystem als Datenbank)

Oliver Bandel oliver at first.in-berlin.de
Fr Okt 21 00:59:43 CEST 2005


On Wed, Oct 19, 2005 at 04:35:52PM +0200, Volker Grabsch wrote:
> On Tue, Oct 18, 2005 at 04:15:57PM +0200, Oliver Bandel wrote:
> > So frage ich denn: Was soll es mit diesem Projekt auf sich haben?
> > 
> > Was willst Du verbessern?
> 
> Vielleicht nochmal kurz zur Trennung von Inhalt und Form: Nehmen wir
> z.B. LaTeX, wo diese Trennung nicht wirklich geglückt ist, und schauen
> uns an, wie die Mathematiker, Physiker etc. ihre Formeln setzen:
> 
>         x \frac{a/b}{c/d}
> 
> Das ist ein Bruch, bei dem "a/b" im Zähler, "c/d" im Nenner steht,
> das ganze multipliziert mit "x". Aber will man das wirklich so genau
> festlegen? Wenn ich z.B. das hier schreibe:
> 
>         x (a/b) / (c/d)
>  
> dann habe ich die Formel in eine Zeile gequetscht. Ich könnte auch
> die Quotienten a/b und c/d jeweils als extra Bruch darstellen:
> 
>         x \frac{\frac{a}{b}}{\frac{c}{d}} 
> 
> oder vielleicht nach dem "x" einen Multiplikationspunkt setzen:
> 
>         x \cdot \frac{\frac{a}{b}}{\frac{c}{d}}
> 
> Oder das "x" in den Zähler mit hineinpacken:
> 
>         \frac{x \frac{a}{b}}{\frac{c}{d}}
[...]


OK, im Prinzip ist dieser Ansatz der Trennung von Form und Inhalt
sehr sinnvoll - das ist es ja, was mit LaTeX auch geschaffen werden
sollte (sogennantes WYSIWYM statt sogennantem WYSIWYG).


> 
> Über all diese Kleinigkeiten macht man sich Gedanken, wenn man eine
> Formel gutaussehend in LaTeX schreiben will, obwohl das überwiegend
> formale Aspekte sind! Stattdessen wäre es doch *eigentlich* wünschens-
> wert, wenn man sich nur auf den Inhalt konzentrieren bräuchte, z.B.
> indem man einfach schreibt:
> 
>         x*(a/b)/(c/d)

Gerne... :)

Aber diese Trennung von form und Inhalt hat da ihre Grenze,
wo man als Autor bestimmte Sachen hervorheben will.

So kann man ja in LaTeX z.B. \emph (statt z.B. \bf oder \it)
einsetzen. Das bedeutet: Man hat weiterhin die Möglichkeit,
Auszeichnungen zu markieren, ohne aber im Dokument selbst
anzugeben, wie es konkret aussieht.

So kann man dann also \emph verschieden belegen - bold oder
italic oder sonstewas.

Aber GANZ auf solcherlei Auszeichnungen zu verzichten
trifft nicht den Kern der Sache einer Veröffentlichung.
Das gilt selbstverständlich nicht nur für Fliesstext, sondern
auch für Formeln. Es kann sehr wohl Sinn machen, bestimmte
Teile einer Formel hervorzuheben...

...da spätestens kann man dann eben nicht mit der Trennung
von Form und Inhalt weiter machen, denn was der Autor aussagen
will, kann sehr verschieden sein und deshalb nur vom Autor
selbst bestimmt werden und nicht von irgend einer Software.

Da sind dann die Grenzen der Trennung erreicht.




> 
> Welche der Divisionen nun per Bruchstrich besser aussehen, und wo
> man lieber einen Schrägstrich "/" verwendet, ob der Mult.-Punkt nun
> gesetzt wird oder nicht, all das sind stilistische Sachen, um die
> sich, wenn überhaupt, höchstens ein Textsetzer kümmern sollte, aber
> doch nicht der Autor!

Im Allgemeinen stimmt das - aber was ist mit Sonderfällen?
Beispiel: Hervorhebung von Termen von Zähler und Nenner
zwecks Erklärung von "Kürzungen" eines Bruches in einem Schulbuch?!

Woher soll die Software wissen, ob es um ein rein mathematisch-forschendes
Paper (pure Beweisführung ohne besondere Hervorhebung(en))
geht oder um einen Text, bei dem diverse Sachen in unkonventioneller
Weise hervor gehoben werden sollen?

Da sind dann eben die Grenzen erreicht, und spätestens da braucht
man eben doch irgendwelche "Hooks".

(Damit will ich aber nicht grundsätzlich die Sinnhaftigkeit Deines/Eures
Ansatzes in Frage stellen - nur eben Grenzen aufzeigen, wo ein weiteres
Vorgehen in einer Richtung zu dogmatisch und auch nicht mehr sinnvoll wird...)


> 
> Dass es auch anders geht, zeigen Mathematik-Programme wie z.B.
> Mathematica. Dort schreibt man die Formel einfach hin wie im
> letzten Beispiel, und er schaut selbst, wie sie am besten aussieht.

Ja, aber das ist ein Programm, das einen ganz bestimmten
Anwendungsfall vorgibt.
=> "wie sie am besten aussieht" meint dann: wie sie am besten für einen
speziellen layout-fall aussieht, und zwar in diesem Falle das Layout,
das man benötigt, wenn man Berechnungen durchführen will und das ganze
"einheitlich" dokumentieren.

LaTeX ist ein SATZprogramm und kein  auf mathematische
Beweisführung/Berechnung spezialisiertes Programm,
und daher gibt es (und muß es auch geben) in LaTeX
bestimmte spezialisierte Auszeichnungs-Möglichkeiten,
die in einem Ansatz, wie Du ihnvertrittst allem Anschein nach
nicht mehr vorhanden wären.



> Wenn das ein Automat übernimmt, hat man außerdem gleich einen
> einheitlichen Stil gewährleistet

Das kann aber auch nach hinten los gehen und in der Einheits-Soße
kann man keinerlei Hervorhebungen mehr finden, und damit wird
das Programm nicht allgemeiner (was man ja möglicherweise auch erreichen will),
sondern spezialisierter - und damit nur wieder eines unter vielen,
und man wird dann wieder eine Erweiterung schreiben wollen, die auch
Auszeichnungen ermöglicht.
XML wurde schliesslich auch als praxistaugliche variante von SGML
erfunden, um dann auch solche Sachen zu machen, die Du hier 
möglicherweise ausmerzen willst?
(erfindest Du SGML neu?)

Das ist dann eher eine DSL für bequeme Dokumentenerstellung als daß
es damit einfacher wird *alle Möglichen* Texte zu erstellen.

Wenn es eine spezialisertere Sprache (DSL) ist, dann macht es keinen Sinn,
diese zu entwickeln, wenn sie antritt, viel allgemeiner zu sein;
aber das ist ja viell. auch garnicht gewollt (weil nicht schwerpunkt)?



> ... was ja sonst eines der größten 
> Probleme ist, wenn z.B. mehrere Autoren in OpenOffice an einem Dokument
> arbeiten wollen.

OpenOffice?
Was soll das denn jetzt?!

> 
> Das meine ich mit Trennung von Inhalt und Form. Nur, dass ich mich
> (erstmal) nicht auf Formeln stürze, sondern auf Dokumente als solches.


Was sind Dokumente als solche?

Und wie weit willst du die Trennung von Inhalt und Form denn gerne
getrieben haben?!


> 
> 
> Ein ganz klassisches analoges Problem in der Wikipedia: Die Tabellen
> sehen entsetzlich aus. Statt HTML-Code bzw. CSS-Einträge vorzunehmen,
> sodass die Tabellen z.B. so gut wie beim DokuWiki aussehen, haben sie
> <table>-Attibute in der Wikisprache erlaubt.

Was wäre stattdessen sinnvoll?


> Das Resultat: Die
> Wikipedianer verschwenden (unter anderem) ihre Zeit damit, in den
> Tabellen für jede Zelle eine ordentliche Hintergrundfarbe zu setzen,
> die breite der Tabellen-Linien festzulegen, u.s.w.

Nun, das viele herum-gewurschtel im layout ist sicherlich in 95% (oder mehr)
der fälle unsinnig.
Aber eine gute Typographie braucht auch die Möglichkeit, in besonderen
Fällen Hervorhebungen zu erlauben.



> 
> Umgekehrt findet sich keiner, der in den Stylesheets für gutaussehende
> Tabellen sorgt, weil es viel "einfacher" ist (d.h. eine viel geringere
> Lern-Hürde darstellt), diese Sachen innerhalb der Wikisprache zu
> erledigen.

Nun - statt das Wiki-Rad neu zu erfinden, warum entwickelst du dann
nicht solche Stylesheets, so daß alle sie fortan nutzen können?

Ist dies nicht Dein Ansatz, den Du immer hervor bringst?
Also, das vorhandene (Stylesheets) zu nutzen, statt anderes
(eine WikiSprache) neu zu erfinden?
Greife doch auf das zurück, was bersits da ist!


> 
> Dabei sollte es genau andersrum sein: Die Text-Autoren sollten erst gar
> nicht auf die *Idee* kommen können, sich um diesen Blödsinn zu kümmern.

Ist nicht immer Blödsinn, auch wenn es dies meistens ist.


> Gerade das wird doch immer wieder als Vorteil von Wikis hervorgehoben:
> Man konzentriert sich mehr auf den Inhalt.

Klar.

Aber so schön es auch ist, Form und Inhalt zu trennen, sollte einem
doch klar sein, daß es letztendlich keine vollkommene Trennung von
form und Inhalt geben kann, denn Form und Inhalt sind immer irgendwie
miteinander verbunden - wenngleich eine weitgehende Separierung oftmals
doch erstrebenswert ist.

Ich darf aber vor Dogmatismen warnen.



> Also sollte es hart bis
> unmöglich sein, die Tabelle stilistisch innerhalb der Wikisprache
> anzupassen,

hmhhh...


> aber im Gegenzug recht einfach, solche Dinge im Stylesheet
> zu ändern.


hmhhhh..... wenn es mehrere Stylesheets für alle Elemente gäbe
(also mehrere Tabellen-stylesheets), dann liesse sich darüber reden.

Also: Eine standard-Tabelle und eine Soundos-tabelle usw. ...
...dann ist das OK.

Aber wenn ALLES immer GLEICh aussieht, ertrinkt man im weissen
rauschen und das hat mit Information nicht zu tun.
Man braucht immer auch das abweichende, ansonsten kann man
seine texte aus dem Rauschen von Z-Dioden erzeugen. ;-)
> 

> So, ich hoffe, zumindest dieser Teil der Kritik (und eines besseren
> Ansatzes) ist nun klar geworden.

Ja, ist klar geworden.

ich hoffe, es ist auch klar geworden, daß eine VOLLKOMMENE
Trennung von Form und Inhalt via WikiDoku-Sprache && Konverter-SW
nicht wirklich zu dem führen kann, was man will.


> Die "zentrale Wiki-XML-Sprache"
> (ich hab sie erstmal WikiDoXML genannt), wird erstmal keine
> stilistischen Details ermöglichen.


Es sollte aber Auszeichnungsmöglichkeiten geben, auch wenn die
Details der Auszeichnungen nicht im Dokument selbst festgelegt
werden können (siehe Erwähnung mit \emph vs. \bf bzw. \it usw.)



Ciao,
   Oliver



Mehr Informationen über die Mailingliste linux-l