[linux-l] Zeichensatz in Textdateien

Volker Grabsch vog at notjusthosting.com
Di Aug 14 22:33:12 CEST 2007


On Tue, Aug 14, 2007 at 09:59:20PM +0200, Norm at nSteinbach wrote:
> Daher meine Frage: Wie erkenne ich, welcher Zeichensatz in einer Datei 
> verwendet wird

Das "file"-Kommando kann den Typ einer Datei ermitteln. Nicht nur,
ob es eine JPEG- oder Text-Datei ist, sondern auch das Encoding einer
Textdatei, sofern genug Sonderzeichen drin sind:

$ ls
test-latin1.txt  test-utf8.txt

$ file test-latin1.txt
test-latin1.txt: ISO-8859 text

$ file test-utf8.txt
test-utf8.txt: UTF-8 Unicode text

> wie ich alle dieser unterschiedlichen Zeichensätze auf 
> einen standardkonformen (d.h. unter jedem Betriebssystem korrekt 
> dargestellten) Zeichensatz umwandeln kann?

Solch einen Zeichensatz gibt es nicht. Aber UTF-8 ist immer eine
gute Wahl. Zum Konvertieren ist "iconv" ein gutes Tool, z.B.:

    iconv -f ISO-8859-1 -t UTF-8 < quelldatei > zieldatei

Siehe:

    man iconv


Gruß,

    Volker

-- 
Volker Grabsch
---<<(())>>---
Administrator
NotJustHosting GbR



Mehr Informationen über die Mailingliste linux-l