[linux-l] Zeichensatz in Textdateien

Steffen Dettmer steffen at dett.de
Sa Aug 18 12:39:16 CEST 2007


* Volker Grabsch wrote on Tue, Aug 14, 2007 at 22:33 +0200:
> $ file test-latin1.txt
> test-latin1.txt: ISO-8859 text

Das ist doch kein Zeichensatz, sondern eine Reihe von Zeichensätzen,
hilft das denn hier überhaupt?

> Solch einen Zeichensatz gibt es nicht. Aber UTF-8 ist immer eine
> gute Wahl. 

Ist UTF-8 nicht bloating in DE, wenn man nur ISO-8859-15 (latin9)
braucht? Mit UTF ist doch selbst ein strlen plötzlich eine "teure"
Funktion, oder?

> Zum Konvertieren ist "iconv" ein gutes Tool, z.B.:
> 
>     iconv -f ISO-8859-1 -t UTF-8 < quelldatei > zieldatei

Mindestens das Eurosymbol ist dann aber kaputt...

oki,

Steffen

-- 
Dieses Schreiben wurde maschinell erstellt,
es trägt daher weder Unterschrift noch Siegel.




Mehr Informationen über die Mailingliste linux-l