[linux-l] Bash und utf8
Steffen Dettmer
steffen at dett.de
Do Dez 14 21:41:28 CET 2006
* Jan-Benedict Glaw wrote on Thu, Dec 14, 2006 at 19:51 +0100:
> On Thu, 2006-12-14 18:28:51 +0100, Steffen Dettmer <steffen at dett.de> wrote:
> > * Jan-Benedict Glaw wrote on Tue, Dec 12, 2006 at 11:39 +0100:
> > > > Das BOM hat durchaus seinen Sinn bei UCS2/UTF16 oder UCS4/UTF32 --
> > > > bei diesen Zeichensätzen ist die Bytereihenfolge tatsächlich
> > > > problematisch, und da sie eh nicht ASCII-kompatibel sind, sollte es
> > > > auch keine Probleme machen.
> > >
> > > Selbst da ist es eine dämliche Idee.
> >
> > Echt! Bei ASCII-Text ist es auch eine Katastrophe, wenn die Byteorder
> > vermixt wird, also vielleicht aus "Hallo " ein "llaH o " wird oder
> > sowas!
>
> ...aber da man ja glücklicherweise weiß, daß ASCII-Texte Byte für Byte
> gelesen werden, und nicht Word per Word, ist das ja auch alles kein
> Problem.
Bei multi-byte-Formaten wird ja wohl immer die Byteorder spezifiziert
sein, so dass sich die "byte order mark" ja nur auf eventuelle
"transport probleme" beziehen kann - die man dann bei ASCII aber genauso
hätte (bzw. eh nie hat - ich hab sowas jedenfalls noch nie erlebt :)).
> Ich bleib' dabei: Wer eine einfache Textdatei öffnet, der solte das
> encoding kennen...
(ich stimme ja mit Dir überein)
Ja, muss er eh; wenn er EBCDIC erwartet aber dann BCD-Zahlen kriegt wird
er wohl Mist damit ausrechnen :-)
oki,
Steffen
--
Dieses Schreiben wurde maschinell erstellt,
es trägt daher weder Unterschrift noch Siegel.
Mehr Informationen über die Mailingliste linux-l