Jetzt muss ich mal kurz mit einer technischen Frage nerven: Ich bin Admin einer Liste (mailman), auf der regelmäßig China-Spam eintrudelt. Jetzt würde ich gerne eine Filterregel definieren, so dass der ganze Müll zuverlässig automatisch entsorgt wird. Naheliegend wäre es, nach dem Subject zu filtern, da diese häufig sehr änlich sind und uns keiner was sinnvolles mit dem Betreff "Art on Canvas" oder "3D Animation Service" schickt.
Das Problem an der Sache: Der Subject-Header bei diesen Mails ist MIME-encoded. Aus "Hand-Painted Art on Canvas, for wall-decoration" wird beispielsweise "=?utf-8?b?SGFuZC1QYWludGVkwqBBcnTCoG9uwqBDYW52YXMswqBm?= =?utf-8?q?or=C2=A0wall-decoration?=".
Kann ich trotzdem irgendwie eine Filterregel definieren, die nicht nur exakt gleiche sondern auch ähnliche Subjects erkennt? Oder gibt es eine andere Möglichkeit, zuverlässig China-Spam als solchen zu erkennen (mit möglichst geringer False-Positive-Rate)? Alles von der TLD .cn zu verwerfen wäre mir zum Beispiel zu ungenau.
Ansonsten bliebe noch der Einsatz von Blacklists, aber da müsste ich erst den Server-Administrator treten.
P.S.: Ich kann Filter als regulären Ausdruck angeben, und zwar auf die Plain-Text-Darstellung des Headers bezogen. Wäre das Subject also wie oben genannt und nicht encoded würde folgende Regel wirken:
Subject: .*Art.*Canvas.*
Lesezeichen