[linux-l] Character-Encoding ermitteln und aendern

Malte Frerichs mfre at kladow.org
Mi Jan 14 12:52:54 CET 2009


Moin zusammen.
Ich habe ein Zeichensatzproblem beim exportieren einer mysql-Datenbank.
Bei der Datenbank handelt es sich um MySQL5. Die Tabellen haben eine
latin1-Kollation.
Nach dem Export der Datenbank mittels mysqldump werden nicht alle
deutschen Umlaute dargestellt. Z.B. sind in dem Dump die Worte "für" und
f<FC>r zu finden.
Der Befehl "file" sagt ueber die Datei "Non-ISO extended-ASCII C++
program text, with very long lines" und nicht wie bei anderen Dumps
"UTF-8 Unicode text, with very long lines".
Laut Doku gibt mysqldump seit MySQL5 den Dump standardmaessig als UTF-8
aus. Eine explizite Angabe, dass er den Dump in als utf8 ausgeben soll
ergibt das gleiche Ergebnis.
Ich habe das Gefuehl als wenn irgendwie verschiedene Zeichensaetze in
der Datei vorhanden sind. Geht das???
Gibt es ein Tool welches verschiedene Zeichensaetze in einer Text-Datei
erkennt und diese dann alle auf einen Zeichensatz konvertiert?
Oder muss ich mir alle Sondermoeglichkeiten fuer die Sonderzeichen
suchen und dann mit "Suchen & Ersetzen" arbeiten?

Mit besten Gruessen

Malte

PS.: Ach ja, unsere Typo3-Auftritte stellen die Umlaute nur manchmal,
wenn der Server unter Last laeuft falsch dar. Falls da noch jemand ne
Idee hat wo ich suchen kann immer her damit. die Apache-Configs, php.ini
etc. wurden schon mehrfach kontrolliert, was die Variablen zum Thema
Characterencoding angeht. Auch komisch ist, dass die Probleme nur unter
Last auftreten.





Mehr Informationen über die Mailingliste linux-l