[lug-ld] Eine Frage zu Spam-Filtern

Christian Boltz lug-ld at cboltz.de
So Jan 18 21:47:55 CET 2015


Hallo Ekki, hallo Leute,

Am Mittwoch, 14. Januar 2015 schrieb Ekki Plicht:
> Ich bekomme ne Menge Backscatter-Mails, also Benachrichtigungen über
> die Unzustellbarkeit von Mails, bei denen ein Spammer meine
> Mailadresse als Absender eingetragen hat. Natürlich habe ich diese
> Mails, die nicht zugestellt werden können, nie verschickt.
> 
> Meine Frage:
> Ist es besser diese Benachrichtigungen beim Trainieren des Filters
> auch als Spam zu kennzeichnen oder nicht? Normalerweise sind solche
> Nachrichten ja durchaus sinnvoll, das ist kein Spam.
> 
> Aber Google packt die alle automatisch in den Spamordner, und ich darf
> die wirklich von mir verursachten Benachrichtigungen dann manuell
> rausfischen. 

Das heißt, Google steckt auch Bounces für Mails, die Du wirklich 
verschickt hast, in den Spam? Nett[tm].

> Das ist bei der Menge an nicht von mir verursachten
> Nachrichten (ca. 10-20/Tag) schon etwas lästig, daher ist ein
> einfaches Löschen einfacher. Das Löschen bestätigt aber Googles
> Spamfilter, eine Kennzeichnung solcher Nachrichten als "Kein Spam"
> trainiert hingegen den Filter in die andere Richtung. Was tun?

Naja, Spamfilter trainieren ist sowas wie die Wahl zwischen Pest und 
Cholera ;-)  - allgemein lautet die Empfehlung, gar kein Training zu 
machen, weil die meisten User schlechter filtern (z. B. vor langem 
bestellte und inzwischen unerwünschte Newsletter als Spam markieren) als 
der Filter es von Haus aus macht. (TL;DR: "Spamfilter kaputttrainieren")

Naja, dazu kommt noch die Frage zum Sinn oder besser Unsinn von 
Spamordnern - Spam direkt rejecten ist definitiv die schlauere Idee 
(sowohl praktisch als auch rechtlich). Aber das sollte ich wohl mal am 
Rand eines Vortrags zu PostfixAdmin erzählen... ;-)

In diesem Fall hast Du diese Optionen leider nicht und/oder der 
Spamfilter von Google wurde durch die Mehrheit der User versaut. 
Ich wage zu behaupten, dass <1% der User Bounces lesen. Alle anderen 
markieren "den Schrott" als Spam - das Ergebnis siehst Du ja.

Theoretisch solltest Du die "erwünschten" Bounces als "kein Spam" 
markieren. Praktisch bezweifle ich, dass Du gegen 99% Windmühlen, 
äh User ankämpfen kannst ;-)

Gibt es bei Google brauchbare Leute im Support? Falls ja, schreib denen 
mal und schildere das Problem, dass erwünschte Bounces im Spam landen. 
(Die Antwort würde mich interessieren ;-)


BTW: Zum Treffen am nächsten Mittwoch kann ich dank eines anderen 
Termins nicht kommen, auch wenn mich der Vortrag durchaus interessiert 
hätte. Ich wünsche Euch trotzdem viel Spaß und würde mich über die 
Slides oder einer Zusammenfassung freuen - Reproduzierbarkeit will man 
ja im Software-Umfeld auch haben [1] ;-)


Gruß

Christian Boltz

[1] Naja, außer bei Zufallsgeneratoren *g*
-- 
Ich habe nix gegen C. Ich kann überhaupt kein C, ich kann es, wenn
es sauber programmiert ist, halbwegs lesen. Vorrausgesetzt, der
Programmierer war nicht zu originell. [Ratti in suse-programming]