txt windows unix
Sonntag, 17. April 2011 und falsche Umlaute sowie sonstige unbrauchbare Zeichen tauchten gestern auf, nachdem Advanced File Joiner die txt-Dateien von 2011 zusammengefasst hatte und diese neue Datei in WORD hätte weiter verarbeitet werden sollen. Es dauerte zwei Stunden, bis Ursache und Zusammenhang herausgefunden werden konnten. Es betraf alle Dateien, die sowohl in einem Windows-Editor wie TextPad und in einem von Linpus auf dem kleinen Acer AspireOne bearbeitet worden waren. Die Textprogramme auf den verschiedenen Computern lesen die ausgetauschten Dateien problemlos, weshalb einem das Geschehen im Hintergrund solange verborgen bleibt, bis ein Windowsprogramm wie der Advanced File Joiner mit solchen Dateien automatisch, also ohne Eingriffsmöglichkeit, umgehen muss.
Ich kenne ein paar Leute, deren Tätigkeit teilweise mit Soft zu beschreiben wäre, denen ich sehr gerne, ja äusserst gerne ein B’haltis in der Schnore deponieren würde, nicht nur von Microsoft. Der Editor auf Windows speichert die austauschbare txt-Datei im Dateiformat PC mit dem Zeichensatz ANSI, derjenige im UNIX-System in UNIX und UTF-8.
Grossschnorern sei gesagt, dass es in einem solchen Fall keine Lösung wäre, störende Dateien durch Speichern Unter im gewünschten Zeichensatz neu zu speichern, weil dann das Entstehungsdatum verändert würde, das unter Umständen, wie jetzt gerade in meinen, wichtig ist. Es muss nun jede einzelne Datei in WORD neu eingefügt werden, so dass bei diesem Vorgang die richtige Codierung gewählt werden kann. Ob der Linux-Computer noch weiter gebraucht werden kann, dünkt mich frühmorgens ziemlich unklar.
Zusatz abends: Nachdem die falsch codierten Dateien (UTF-8 statt ANSI) einzeln in WORD eingefügt worden sind, konvertiert, und das Projekt der Sammlung aller Blogeinträge in einer einzigen PDF-Datei vorwärts kommt, habe ich den Editor des Linpus-Computers genauer studiert. Für die kommende Praxis kann Entwarnung gegeben werden. Der Editor lädt die ANSI-Dateien korrekt und speichert die veränderten weiterhin mit demselben gewünschten Zeichensatz. Wurde die Datei ursprünglich auf einem Windows-Computer erstellt, hat sie die normale Codierung auch nach diversen Wechseln der Systeme beibehalten. Nur wenn die ersten Zeilen eines Textes auf dem Acer-Computer geschrieben wurden, war der Text mit UTF-8 codiert, auch wenn er mit dem Windows-Editor nachher weiterbearbeitet worden war. Nur wenn ein Text anfänglich auf dem kleinen Computer geschrieben wird, muss beim ersten Abspeichern als Speichern Unter darauf geachtet werden, dass die Codierung auf ISO-8859-1 oder ISO-8859-15 (mit dem Eurozeichen) gewechselt wird. Was nicht geht, ist den Editor so einzustellen, dass er immer beim Speichern Unter diesen Zeichensatz wählt. Aufgepasst also in Drunkenheit beim Schreiben und ersten Speichern!
Kommentar: Für den Einzelnen scheint das Problem einigermassen gering, jedenfalls bewältigbar. Wenn man an grosse Betriebe im deutschsprachigen Raum und an ihre MitarbeiterInnen denkt, die verschiedene Systeme benutzen – besteht da wirklich keine Gefahr, dass eine Textpassage, die mehr als nur semantische Gehalte transportiert, auch einmal falsche Signale auslöst?