[linux-l] Bash und utf8

Steffen Dettmer steffen at dett.de
Do Dez 14 21:41:28 CET 2006


* Jan-Benedict Glaw wrote on Thu, Dec 14, 2006 at 19:51 +0100:
> On Thu, 2006-12-14 18:28:51 +0100, Steffen Dettmer <steffen at dett.de> wrote:
> > * Jan-Benedict Glaw wrote on Tue, Dec 12, 2006 at 11:39 +0100:
> > > > Das BOM hat durchaus seinen Sinn bei UCS2/UTF16 oder UCS4/UTF32 --
> > > > bei diesen Zeichensätzen ist die Bytereihenfolge tatsächlich
> > > > problematisch, und da sie eh nicht ASCII-kompatibel sind, sollte es
> > > > auch keine Probleme machen.
> > > 
> > > Selbst da ist es eine dämliche Idee.  
> > 
> > Echt! Bei ASCII-Text ist es auch eine Katastrophe, wenn die Byteorder
> > vermixt wird, also vielleicht aus "Hallo   " ein "llaH  o " wird oder
> > sowas!
> 
> ...aber da man ja glücklicherweise weiß, daß ASCII-Texte Byte für Byte
> gelesen werden, und nicht Word per Word, ist das ja auch alles kein
> Problem.   

Bei multi-byte-Formaten wird ja wohl immer die Byteorder spezifiziert
sein, so dass sich die "byte order mark" ja nur auf eventuelle
"transport probleme" beziehen kann - die man dann bei ASCII aber genauso
hätte (bzw. eh nie hat - ich hab sowas jedenfalls noch nie erlebt :)).

> Ich bleib' dabei: Wer eine einfache Textdatei öffnet, der solte das
> encoding kennen...

(ich stimme ja mit Dir überein)

Ja, muss er eh; wenn er EBCDIC erwartet aber dann BCD-Zahlen kriegt wird
er wohl Mist damit ausrechnen :-)

oki,

Steffen

-- 
Dieses Schreiben wurde maschinell erstellt,
es trägt daher weder Unterschrift noch Siegel.





Mehr Informationen über die Mailingliste linux-l