[linux-l] Texte effektiv speichern
Thomas Kaepernick
Thomas.Kaepernick at web.de
So Sep 30 21:44:46 CEST 2007
Am Sun, Sep 30, 2007 at 02:29:53PM +0200, schrieb Volker Grabsch:
> On Sun, Sep 30, 2007 at 09:56:41AM +0200, Thomas Schmidt wrote:
> > Auf unserem Server werden kleine Texte zum Ausdrucken für die Besucher
> > generiert. Enthalten sind kleine Bilder und Tabellen. Jetzt suchen wir
> > eine Möglichkeit, sie so platzsparend wie möglich zu erstellen, damit
> > wenig Müll auf der Platte entsteht.
> >
> > Möglichkeiten:
> > PDF mit zwei UTF-8 Schriftarten a 130kB = 280kB pro Dokument
> > PDF mit eingebettetem GIF, pro Seite 100kB
> > HTML mit viel CSS und Bildern in CSS nicht probiert, wahrscheinlich
> > weniger, aber wegen der Browserbugs nicht gut transportabel
>
> Es gibt dann noch OpenDocument (ODT).
>
> Aber ich würde einen Schritt eher ansetzen, und die Texte mitsamt
> Bilder als LaTeX speichern.
>
> Ein kleines Script bringt dann die jpg/gif/png-Bildern ins
> EPS-Format und jagt alles durch latex, dvips, ps2pdf durch.
Ich koennte noch groff/troff anbieten. Die Moeglichkeiten sind
zwar beschraenkter als in LaTeX. Bilder lassen sich aber ggf. auch
einbinden. Es muessen andererseits keine packages eingebunden werden.
>
> (Man kann auch direkt pdflatex nutzen, aber das Ergebnis ist
> etwa das Gleiche, und pdflatex kann keine Schriftfarben).
>
> Auch interessant, wenn die zwei Seiten der doppelseitigen
> Dokumente unabhängig voneinander sind: SVG-Grafik. Sehr
> einfaches Format für Text und Grafik, wird zunehmens auch
> von Browsern unterstützt, kann mit "inkscape -P ..." nach
> Postscript gewandelt werden.
>
> > Ein Ansatz wäre, aus den Schriftarten alle nicht benötigten Zeichen zu
> > löschen. Oder eine gute Kompression sieht die Ähnlichkeiten der Dateien
> > untereinander und packt sie geschickt. Für beides habe ich keine Lösung
> > gefunden.
>
> Der Ansatz geht IMHO zu weit am Ende los. Dein nachfolgender
> Vorschlag ist IMHO der Richtige Weg[tm]:
>
> > Auch möglich wäre, in der Generierung der PDFs mit TCPDF (PHP-Klasse)
> > eine selbstentwickelte Sprache zwischenzuschalten, die nur 10kB pro Text
> > verursacht und jederzeit mit Hilfe der Klasse das PDF erstellen kann.
> > Ich schrecke nur davor zurück, dass irgendwann die Texte nicht mehr
> > lesbar sind, weil das Script nirgends läuft.
>
> Nimm LaTeX anstelle der "selbstentwickelten Sprache".
>
> Oder lass dein Script LaTeX-Code anstelle von PDF erzeugen, das
> ist einfach und portabel. Hast du dennoch Angst vor zukünftigen
> PHP-Inkompatibilitäten, dann nimm Python, die Sprache ist schlanker
> designt, und einfache Scripte, die man vor Jahren in Python-1.5
> geschrieben hat, laufen auch heute unter Python-2.5 noch ordentlich.
>
> Oder, wenn's wirklich portabel sein soll, ein Shellscript mit
> eingebettetem "sed" oder "awk", damit lassen sich einfache Sprach-
> Übersetzungen auch schon erledigen.
>
> Aber, wiegesagt, anstelle der "selbstentwickelten Sprache" würde
> ich direkt LaTeX nehmen, oder eine Variante davon (LOUT, ...).
>
> Die selbe Argumentation spricht übrigens auch für HTML. Etwas
> Text mit Bildchen gut zu formatieren, dafür bedarf es keiner großen
> CSS-Aktionen. Halte den HTML-Code so einfach wie möglich, und
> vermeide die "div"-Falle: Benutze <h1> für Überschriften, und
> keinen Unsinn wie <div class="ueberscript">. Dann zeigt es auch
> ein Browser ohne CSS-Unterstützung noch ordentlich an.
>
> Aber ob LaTeX oder HTML, das kommt ganz darauf an, was du mit
> diesen Texten vorrangig machen willst: Soll das auf Web-Benutzung
> oder auf Ausdrucke optimiert werden.
>
> Beides gleichzeitig geht auch, mit XML-Sprachen wie DocBook
> oder wikiartigen Sprachen wie reStructuredText. Bei denen sind
> aber gute PDF- bzw. HTML-Generatoren ein Problem. MediaWiki hat
> gute HTML-Erzeugung, krankt aber bei der PDF-Generierung.
>
>
> Gruß,
>
> Volker
>
> --
> Volker Grabsch
> ---<<(())>>---
> Administrator
> NotJustHosting GbR
> _______________________________________________
> linux-l mailing list
> linux-l at mlists.in-berlin.de
> Die Mailingliste der BeLUG (Berliner Linux User Group)
>
> Wenn du diese Mailingliste abbestellen willst, gehe bitte auf
> https://mlists.in-berlin.de/mailman/listinfo/linux-l-mlists.in-berlin.de
> und trage dich dort bitte aus
Mehr Informationen über die Mailingliste linux-l