"Roland M. Kruggel" <[EMAIL PROTECTED]> writes: > Hallo Liste, > > ich suchen in mehreren ascii-Dateien non-ascii Zeichen.
Das wären alle außerhalb des Bereichs 0x00..0x7f. > Also alles was nicht Buchstabe, Zahl, Was ist mit ° oder ²? oder kyrillischen Buchstaben? > Umlaut Und das hängt völlig vom verwendeten Zeichensatz ab. Ich fange jetzt lieber nicht auch noch vom Euro an. > oder Sonderzeichen Das hängt von der Definition und auch vom Zeichensatz ab. Ich fürchte, du musst die Aufgabenstellung genauer klären. Wenn man den einfachsten Fall annimmt, möchtest du alle nicht-druckbaren ASCII-Zeichen. Dann würde so was reichen: sed 's/[^ -~]/#/g' um alle zu ersetzen. Weitere Buchstaben, die du ersetzen willst, kannst du direkt hinter den ^ oder ~ schreiben (einfach aufzählen). Insbesondere bei den Umlauten sehe ich Probleme, da es dafür zwei gängige Codierungen gibt. Nicht umsonst hat jede Mail hier einen Header, der den Zeichensatz liefert, sofern ASCII nicht ausreicht. Wenn du Umlaute haben willst, kann es ziemlich kompliziert werden. Es spielt ja nicht nur der Zeichensatz in der zu bearbeitenden Datei eine Rolle, sondern auch noch der, in der sich dein sed-Ausdruck befindet. Vielleicht reicht es ja schon wie oben, auch wenn das Ergebnis schwerlich portabel sein wird. Ansonsten solltest du vielleicht genauer beschreiben, was du machen willst. Gruß, Heike -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)