[linux-l] Zeichensatz in Textdateien

Jan-Benedict Glaw jbglaw at lug-owl.de
Di Aug 14 22:28:49 CEST 2007


On Tue, 2007-08-14 21:59:20 +0200, Norm at nSteinbach <norm at nsteinbach.de> wrote:
> ich habe hier eine Menge Textdateien, die unter verschiedenen 
> Betriebssystemen erstellt wurden, und ebenso unter verschiedenen 
> Betriebssystemen korrekt lesbar sein sollen.
> Daher meine Frage: Wie erkenne ich, welcher Zeichensatz in einer Datei 
> verwendet wird (dabei geht es eigentlich nur um die deutschen Umlaute ä, 
> ö, ü, ß), und wie ich alle dieser unterschiedlichen Zeichensätze auf 
> einen standardkonformen (d.h. unter jedem Betriebssystem korrekt 
> dargestellten) Zeichensatz umwandeln kann?
> Zusatzinformation: Meine Fähigkeiten in Bezug auf Shellscripte 
> beschränken sich darauf, diese auszführen (bzw. zu lesen und in Ansätzen 
> zu verstehen, aber sowie "nicht-selbsterklärende" Syntaxelemente 
> enthalten sind, ist Schluss)

Mit etwas Glück reichts zum Herausfinden schon, `file' anzuwenden. Als
lingua franca würd' ich UTF-8 nehmen.  Die Konvertierung ist einfach
mit `iconv' zu machen.

MfG, JBG

-- 
      Jan-Benedict Glaw      jbglaw at lug-owl.de              +49-172-7608481
Signature of: They that give up essential liberty to obtain temporary safety,
the second  : deserve neither liberty nor safety.  (Ben Franklin)
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : signature.asc
Dateityp    : application/pgp-signature
Dateigröße  : 189 bytes
Beschreibung: Digital signature
URL         : <https://mlists.in-berlin.de/pipermail/linux-l-mlists.in-berlin.de/attachments/20070814/96ceeaaa/attachment.sig>


Mehr Informationen über die Mailingliste linux-l