[lug-ld] Eine Frage zu Spam-Filtern
Christian Boltz
lug-ld at cboltz.de
So Jan 18 21:47:55 CET 2015
Hallo Ekki, hallo Leute,
Am Mittwoch, 14. Januar 2015 schrieb Ekki Plicht:
> Ich bekomme ne Menge Backscatter-Mails, also Benachrichtigungen über
> die Unzustellbarkeit von Mails, bei denen ein Spammer meine
> Mailadresse als Absender eingetragen hat. Natürlich habe ich diese
> Mails, die nicht zugestellt werden können, nie verschickt.
>
> Meine Frage:
> Ist es besser diese Benachrichtigungen beim Trainieren des Filters
> auch als Spam zu kennzeichnen oder nicht? Normalerweise sind solche
> Nachrichten ja durchaus sinnvoll, das ist kein Spam.
>
> Aber Google packt die alle automatisch in den Spamordner, und ich darf
> die wirklich von mir verursachten Benachrichtigungen dann manuell
> rausfischen.
Das heißt, Google steckt auch Bounces für Mails, die Du wirklich
verschickt hast, in den Spam? Nett[tm].
> Das ist bei der Menge an nicht von mir verursachten
> Nachrichten (ca. 10-20/Tag) schon etwas lästig, daher ist ein
> einfaches Löschen einfacher. Das Löschen bestätigt aber Googles
> Spamfilter, eine Kennzeichnung solcher Nachrichten als "Kein Spam"
> trainiert hingegen den Filter in die andere Richtung. Was tun?
Naja, Spamfilter trainieren ist sowas wie die Wahl zwischen Pest und
Cholera ;-) - allgemein lautet die Empfehlung, gar kein Training zu
machen, weil die meisten User schlechter filtern (z. B. vor langem
bestellte und inzwischen unerwünschte Newsletter als Spam markieren) als
der Filter es von Haus aus macht. (TL;DR: "Spamfilter kaputttrainieren")
Naja, dazu kommt noch die Frage zum Sinn oder besser Unsinn von
Spamordnern - Spam direkt rejecten ist definitiv die schlauere Idee
(sowohl praktisch als auch rechtlich). Aber das sollte ich wohl mal am
Rand eines Vortrags zu PostfixAdmin erzählen... ;-)
In diesem Fall hast Du diese Optionen leider nicht und/oder der
Spamfilter von Google wurde durch die Mehrheit der User versaut.
Ich wage zu behaupten, dass <1% der User Bounces lesen. Alle anderen
markieren "den Schrott" als Spam - das Ergebnis siehst Du ja.
Theoretisch solltest Du die "erwünschten" Bounces als "kein Spam"
markieren. Praktisch bezweifle ich, dass Du gegen 99% Windmühlen,
äh User ankämpfen kannst ;-)
Gibt es bei Google brauchbare Leute im Support? Falls ja, schreib denen
mal und schildere das Problem, dass erwünschte Bounces im Spam landen.
(Die Antwort würde mich interessieren ;-)
BTW: Zum Treffen am nächsten Mittwoch kann ich dank eines anderen
Termins nicht kommen, auch wenn mich der Vortrag durchaus interessiert
hätte. Ich wünsche Euch trotzdem viel Spaß und würde mich über die
Slides oder einer Zusammenfassung freuen - Reproduzierbarkeit will man
ja im Software-Umfeld auch haben [1] ;-)
Gruß
Christian Boltz
[1] Naja, außer bei Zufallsgeneratoren *g*
--
Ich habe nix gegen C. Ich kann überhaupt kein C, ich kann es, wenn
es sauber programmiert ist, halbwegs lesen. Vorrausgesetzt, der
Programmierer war nicht zu originell. [Ratti in suse-programming]