[linux-l] Re: Bash und utf8

Rocco Rutte pdmef at cs.tu-berlin.de
Di Dez 12 08:00:23 CET 2006


Hi,

* Jan-Benedict Glaw [06-12-11 23:07:58 +0100] wrote:

>Die BOM ist eine der fatalsten Erfindungen, die je gemacht worden ist.
>Es käme ja auch niemand auf die Idee "us-ascii" an den Anfang eines
>simplen Textes zu schreiben...  Aber gerade *weil* die BOM so, erm,
>"besonders exotisch" ist, implementieren leider einige Editoren das:-/

Ich habe da ein gespaltenes Verhältnis. Erstens ist es ziemlich, äh 
"unglücklich" das auch noch mit Bytes jenseits von 0x80 zu kennzeichnen 
und dann gleich noch mehrere...

Andererseits: es löst zumindest das Problem, dass man weiss welches 
(Unicode) Encoding ein File hat. Das weiss man jetzt nämlich nicht, und 
es kann schief gehen, wenn man es über die locale ausknobelt und man ein 
File mit einem anderen Encoding bekommt. Und Insellösungen wie vim's 
modelines sind nicht portabel.

Für ein saubere Lösung fehlen mir auch die Ideen, bei denen man keine 
Bauschmerzen bekommt (z.B.: per Definition alles in UTF8 und dann 
transparent auf locales umkodieren, Metainformationen im Filesystem, 
etc; alles ganz schön krank ;-).

   bye, Rocco
-- 
:wq!



Mehr Informationen über die Mailingliste linux-l