[linux-l] Zeichensatz in Textdateien
Volker Grabsch
vog at notjusthosting.com
Di Aug 14 22:33:12 CEST 2007
On Tue, Aug 14, 2007 at 09:59:20PM +0200, Norm at nSteinbach wrote:
> Daher meine Frage: Wie erkenne ich, welcher Zeichensatz in einer Datei
> verwendet wird
Das "file"-Kommando kann den Typ einer Datei ermitteln. Nicht nur,
ob es eine JPEG- oder Text-Datei ist, sondern auch das Encoding einer
Textdatei, sofern genug Sonderzeichen drin sind:
$ ls
test-latin1.txt test-utf8.txt
$ file test-latin1.txt
test-latin1.txt: ISO-8859 text
$ file test-utf8.txt
test-utf8.txt: UTF-8 Unicode text
> wie ich alle dieser unterschiedlichen Zeichensätze auf
> einen standardkonformen (d.h. unter jedem Betriebssystem korrekt
> dargestellten) Zeichensatz umwandeln kann?
Solch einen Zeichensatz gibt es nicht. Aber UTF-8 ist immer eine
gute Wahl. Zum Konvertieren ist "iconv" ein gutes Tool, z.B.:
iconv -f ISO-8859-1 -t UTF-8 < quelldatei > zieldatei
Siehe:
man iconv
Gruß,
Volker
--
Volker Grabsch
---<<(())>>---
Administrator
NotJustHosting GbR
Mehr Informationen über die Mailingliste linux-l