{"id":884,"date":"2011-04-17T05:33:03","date_gmt":"2011-04-17T04:33:03","guid":{"rendered":"http:\/\/ueliraz.ch\/WordPress\/?p=884"},"modified":"2011-04-22T21:19:26","modified_gmt":"2011-04-22T20:19:26","slug":"i%c2%bb%c2%bf-txt-windows-unix","status":"publish","type":"post","link":"https:\/\/ueliraz.ch\/WordPress\/?p=884","title":{"rendered":"\u00ef\u00bb\u00bf txt windows unix"},"content":{"rendered":"<p>\u00ef\u00bb\u00bf und falsche Umlaute sowie sonstige unbrauchbare Zeichen tauchten gestern auf, nachdem Advanced File Joiner die txt-Dateien von 2011 zusammengefasst hatte und diese neue Datei in WORD h\u00e4tte weiter verarbeitet werden sollen. Es dauerte zwei Stunden, bis Ursache und Zusammenhang herausgefunden werden konnten. Es betraf alle Dateien, die sowohl in einem Windows-Editor wie TextPad und in einem von Linpus auf dem kleinen Acer AspireOne bearbeitet worden waren. Die Textprogramme auf den verschiedenen Computern lesen die ausgetauschten Dateien problemlos, weshalb einem das Geschehen im Hintergrund solange verborgen bleibt, bis ein Windowsprogramm wie der Advanced File Joiner mit solchen Dateien automatisch, also ohne Eingriffsm\u00f6glichkeit, umgehen muss.<\/p>\n<p>Ich kenne ein paar Leute, deren T\u00e4tigkeit teilweise mit Soft zu beschreiben w\u00e4re, denen ich sehr gerne, ja \u00e4usserst gerne ein B&#8217;haltis in der Schnore deponieren w\u00fcrde, nicht nur von Microsoft. Der Editor auf Windows speichert die austauschbare txt-Datei im Dateiformat PC mit dem Zeichensatz ANSI, derjenige im UNIX-System in UNIX und UTF-8. <\/p>\n<p>Grossschnorern sei gesagt, dass es in einem solchen Fall keine L\u00f6sung w\u00e4re, st\u00f6rende Dateien durch Speichern Unter im gew\u00fcnschten Zeichensatz neu zu speichern, weil dann das Entstehungsdatum ver\u00e4ndert w\u00fcrde, das unter Umst\u00e4nden, wie jetzt gerade in meinen, wichtig ist. Es muss nun jede einzelne Datei in WORD neu eingef\u00fcgt werden, so dass bei diesem Vorgang die richtige Codierung gew\u00e4hlt werden kann. Ob der Linux-Computer noch weiter gebraucht werden kann, d\u00fcnkt mich fr\u00fchmorgens ziemlich unklar.<\/p>\n<p>Zusatz abends: Nachdem die falsch codierten Dateien (UTF-8 statt ANSI) einzeln in WORD eingef\u00fcgt worden sind, konvertiert, und das Projekt der Sammlung aller Blogeintr\u00e4ge in einer einzigen PDF-Datei vorw\u00e4rts kommt, habe ich den Editor des Linpus-Computers genauer studiert. F\u00fcr die kommende Praxis kann Entwarnung gegeben werden. Der Editor l\u00e4dt die ANSI-Dateien korrekt und speichert die ver\u00e4nderten weiterhin mit demselben gew\u00fcnschten Zeichensatz. Wurde die Datei urspr\u00fcnglich auf einem Windows-Computer erstellt, hat sie die normale Codierung auch nach diversen Wechseln der Systeme beibehalten. Nur wenn die ersten Zeilen eines Textes auf dem Acer-Computer geschrieben wurden, war der Text mit UTF-8 codiert, auch wenn er mit dem Windows-Editor nachher weiterbearbeitet worden war. Nur wenn ein Text anf\u00e4nglich auf dem kleinen Computer geschrieben wird, muss beim ersten Abspeichern als Speichern Unter darauf geachtet werden, dass die Codierung auf ISO-8859-1 oder ISO-8859-15 (mit dem Eurozeichen) gewechselt wird. Was nicht geht, ist den Editor so einzustellen, dass er immer beim Speichern Unter diesen Zeichensatz w\u00e4hlt. Aufgepasst also in Drunkenheit beim Schreiben und ersten Speichern!<\/p>\n<p>Kommentar: F\u00fcr den Einzelnen scheint das Problem einigermassen gering, jedenfalls bew\u00e4ltigbar. Wenn man an grosse Betriebe im deutschsprachigen Raum und an ihre MitarbeiterInnen denkt, die verschiedene Systeme benutzen &#8211; besteht da wirklich keine Gefahr, dass eine Textpassage, die mehr als nur semantische Gehalte transportiert, auch einmal falsche Signale ausl\u00f6st?<\/p>\n","protected":false},"excerpt":{"rendered":"<p>\u00ef\u00bb\u00bf und falsche Umlaute sowie sonstige unbrauchbare Zeichen tauchten gestern auf, nachdem Advanced File Joiner die txt-Dateien von 2011 zusammengefasst hatte und diese neue Datei in WORD h\u00e4tte weiter verarbeitet werden sollen. Es dauerte zwei Stunden, bis Ursache und Zusammenhang herausgefunden werden konnten. Es betraf alle Dateien, die sowohl in einem Windows-Editor wie TextPad und [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"https:\/\/ueliraz.ch\/WordPress\/index.php?rest_route=\/wp\/v2\/posts\/884"}],"collection":[{"href":"https:\/\/ueliraz.ch\/WordPress\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/ueliraz.ch\/WordPress\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/ueliraz.ch\/WordPress\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/ueliraz.ch\/WordPress\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=884"}],"version-history":[{"count":5,"href":"https:\/\/ueliraz.ch\/WordPress\/index.php?rest_route=\/wp\/v2\/posts\/884\/revisions"}],"predecessor-version":[{"id":895,"href":"https:\/\/ueliraz.ch\/WordPress\/index.php?rest_route=\/wp\/v2\/posts\/884\/revisions\/895"}],"wp:attachment":[{"href":"https:\/\/ueliraz.ch\/WordPress\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=884"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/ueliraz.ch\/WordPress\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=884"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/ueliraz.ch\/WordPress\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=884"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}