"Roland M. Kruggel" <[EMAIL PROTECTED]> writes:

> Hallo Liste,
>
> ich suchen in mehreren ascii-Dateien non-ascii Zeichen.

Das wären alle außerhalb des Bereichs 0x00..0x7f.

> Also alles was nicht Buchstabe, Zahl,

Was ist mit ° oder ²? oder kyrillischen Buchstaben?

> Umlaut

Und das hängt völlig vom verwendeten Zeichensatz ab.  Ich fange jetzt
lieber nicht auch noch vom Euro an.

> oder Sonderzeichen

Das hängt von der Definition und auch vom Zeichensatz ab.

Ich fürchte, du musst die Aufgabenstellung genauer klären.

Wenn man den einfachsten Fall annimmt, möchtest du alle
nicht-druckbaren ASCII-Zeichen. Dann würde so was reichen:

 sed 's/[^ -~]/#/g'

um alle zu ersetzen.  Weitere Buchstaben, die du ersetzen willst,
kannst du direkt hinter den ^ oder ~ schreiben (einfach aufzählen).

Insbesondere bei den Umlauten sehe ich Probleme, da es dafür zwei
gängige Codierungen gibt.  Nicht umsonst hat jede Mail hier einen
Header, der den Zeichensatz liefert, sofern ASCII nicht ausreicht.

Wenn du Umlaute haben willst, kann es ziemlich kompliziert werden.  Es
spielt ja nicht nur der Zeichensatz in der zu bearbeitenden Datei eine
Rolle, sondern auch noch der, in der sich dein sed-Ausdruck befindet.

Vielleicht reicht es ja schon wie oben, auch wenn das Ergebnis
schwerlich portabel sein wird.  Ansonsten solltest du vielleicht
genauer beschreiben, was du machen willst.


Gruß,

 Heike


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)

Antwort per Email an