Moin Community,
ich bin gerade dabei eine Email-Anwendung zu entwickeln. Ich mache mir gerade Gedanken darüber wie ich Wörter in einer Mail gewichte, sodaß man genauer sagen kann, dass es sich um eine Spam-Nachricht handelt.
Also hat einer ne Plan welche Wörter in einer Spam-Nachricht mehr vorkommen als Andere ?
z.B. 1x Viagra und 1x XXX ----> garantiert Spam
Und das ganze mit einer Gewichtung für bestimmte Wörter und deren Vorkommen in Spam-Nachrichten.
Danke an alle die Antwort und diesen Beitrag lesen.