[linux-l] Bash und utf8

Jan-Benedict Glaw jbglaw at lug-owl.de
Di Dez 12 11:39:35 CET 2006


On Tue, 2006-12-12 06:25:17 +0100, olafBuddenhagen at gmx.net <olafBuddenhagen at gmx.net> wrote:
> On Mon, Dec 11, 2006 at 11:07:58PM +0100, Jan-Benedict Glaw wrote:
> > Die BOM ist eine der fatalsten Erfindungen, die je gemacht worden ist.
> > Es käme ja auch niemand auf die Idee "us-ascii" an den Anfang eines
> > simplen Textes zu schreiben...
> 
> Das BOM hat durchaus seinen Sinn bei UCS2/UTF16 oder UCS4/UTF32 -- bei
> diesen Zeichensätzen ist die Bytereihenfolge tatsächlich problematisch,
> und da sie eh nicht ASCII-kompatibel sind, sollte es auch keine Probleme
> machen.

Selbst da ist es eine dämliche Idee.  Am Ende vom Tag sprechen wir von
einfachen, simplen Textdateien. Wir reden nicht über Container mit
eingebetteten Objekten (Word-Dokumente...) oder hierarchischen
Strukturen (XML-Dokumente), sondern simplen Textdateien.

Und bei ebendiesen hat schon *immer* der Leser selbst entscheiden
müssen, was die zum sinnvollen Lesen benötigte Zeichenkodierung ist.
Warum sollte man das jetzt ändern?

> Bei UTF8 ist es tatsächlich eine ausgesprochen bescheuerte Idee... Ich
> frage mich ob das überhaupt Standardkonform ist, oder eher ein
> Missverständniss einiger Programmierer -- ich vermute eher das Zweite.

Nee, leider zulässig.

MfG, JBG

-- 
      Jan-Benedict Glaw      jbglaw at lug-owl.de              +49-172-7608481
Signature of:                 Gib Dein Bestes. Dann übertriff Dich selbst!
the second  :
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : signature.asc
Dateityp    : application/pgp-signature
Dateigröße  : 189 bytes
Beschreibung: Digital signature
URL         : <https://mlists.in-berlin.de/pipermail/linux-l-mlists.in-berlin.de/attachments/20061212/14f3758a/attachment.sig>


Mehr Informationen über die Mailingliste linux-l