Hallo,

kann man eigentlich Variablen auch in den regular expressions verwenden? Bin dabei, Spam nach URLs zu filtern. Zur Zeit sieht das noch so aus:

:0B
* ^[^>]*($|.)*http://.+(com|co\.uk|us|biz|net|info|yahoo\.com|ca|ws|t [vw])($|.)*
{
# einzelne domains
:0B
* http://.*(fallow|firstrate.*|flabby|forall.*|forever.*|fuchsia)\..+
$URL
}
$URL


Die Wahrscheinlichkeit, damit die richtigen URLs zu erwischen, ist schon recht hoch. Gibt es aber in mehreren Zeilen der Mail URLs, wuerde dieses Konstrukt aber nicht nur www.firstrate-stock.com finden, sondern beispielsweise auch www.firstrate-stock.de. Vermutlich waere auch das Spam, insofern waere die Ungenauigkeit vielleicht sogar wuenschenswert. Genauere Ergebnisse koennte man aber erzielen, wenn man allen Domains noch die TLDs mitgaebe:

TLD="(com|co\.uk|us|biz|net|info|yahoo\.com|ca|ws|t[vw])($|.)"

:0B
* http://.*(fallow|firstrate.*|flabby|forall.*|forever.*|fuchsia)$TLD \..+
$URL


Das funktioniert aber nicht; wohl, weil "$" in reg-exes ein Zeilenende markiert. Wie kann man also so etwas realisieren?

Schoenen Gruss,

Andreas


--
Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/


Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)



Reply via email to