[linux-l] Spam-Sortiererei (was: Embbeded Computer als CD-/MP3-Player im Netzwerk)

Steffen Dettmer steffen at dett.de
Di Jan 8 00:11:05 CET 2008


* Jan-Benedict Glaw wrote on Mon, Jan 07, 2008 at 08:49 +0100:
> > > > Aber dann braucht man doch noch einen Rechner, wo das pulseaudio drauf
> > > > läuft, oder?
> > > 
> > > Jein. Du brauchst ein Programm, daß die PA-Client-Library benutzt.
> > > 
> > > Wenn man z.B. die MP3-Datei nach stdout "entpackt" und von da aus
> > > pacat (als PulseAudio-Client) benutzt, tut das schon.
> > 
> > Für das Entpacken von MP3 nach stdout braucht man doch genausoviel CPU
> > wie zum Entpacken von MP3 nach /dev/dsp0 (oder was man da hat)?
> 
> Wenn man das auf einem *fremden* Rechner macht, dann nicht.

OK, dann braucht man eben doch noch einen *fremden* Rechner...  (?!)

> > ok. Hast Du Informationen / Links zu dem Thema, warum/wann
> > Wegwerf-Adressen Nachteile haben und welche? Mit google finde ich
> > leider nicht wirklich was (was an meinen schlechten Suchbegriffen
> > liegt?).
> 
> Sie haben den Nachteil, daß, wenn ich so'ne Mail in 5 Jahren finde,
> ich nicht mehr direkt an den Schreiberling herantreten kann.

Ach so, nee, man kann die weiterhin nutzen, dann werden die Mails bloss
`normal' behandelt und durch den Spamfilter ausgeliefert (wenn nicht
gerade explizit geblockt). Die Addressen sind also weiterhin gültig, nur
gehen nicht mehr am (zweiten) Spamfilter und scoring vorbei sondern
müssen da ganz normal durch (postgrey läuft auch, aber das ist ja
sozusagen eine andere Ebene). Die sind dann nach meiner aktuellen
Vorstellung wie eine Mail an steffen at . 

`junge Addressen' hingegen landen in INBOX und werden optisch
hervorgehoben (wie auch Mails von und an bestimmte Addressen usw).

Diese Addressen sollen vor allem false-positives verhindern (Filter -
aber vor allem mein menschliches Versagen, was schon mehrfach zuschlug).

Ich gehe davon aus, dass aktuell Spambots die Mails erst nach drei
Monaten oder so massiv bespammen. Wenn jemand schneller antwortet, ist
es also kein Spam und wird im mutt entsprechend markiert.

Mit `Wegwerf-Addressen' hab ich mich falsch ausgedrückt, ich meinte eher
`Addressen-mit-bekanntem-Alter'. Nee, klingt auch blöd... naja

> > d.h. bogofilter und Spamassin? Warum ist das besser als signierte
> > Addressen und Spamfilter?
> 
> Signatur hin oder her: Auch ein Spam-Versender kann seine Mails
> signieren. 

Mailsignatur ist ja egal, oder meinst Du so eine Addresse verwenden?
Dann ja klar, aber ich habe den Eindruck, dass das immer ne Weile
dauert, bis so ne Addresse `rum' ist. Neue sind ne ganze Weile immer
sauber. Wenn ein Spambot wirklich so schlau sein sollte, extra für mich
ne Funktion haben zu sollen, in der das Datum gegen ein jüngeres
getauscht werden sollte (was ich mir beim besten Willen nicht vorstellen
kann), stimmt der hash nicht mehr und die Addresse ist `ungültig'.

  (das heisst im Moment ist sie grell in der INBOX, weil ich davon
   ausgehe, dass es sich in so einem Fall um einen Bug in einem Script
   handelt)

> > (muss man bogofilter und Spamassin nicht auch konfigurieren und
> > trainieren?)
> 
> Aber sicher.

na ja, macht ja aber auch ne Menge Arbeit (obwohl sich das nach eher
wenig bzw. einer überschaubaren Menge anhört). 

Ich würde es bestimmt wieder schaffen, nicht-Spam falsch einzusortieren
und damit Mails zu verlieren :(

Zu baynes-Filtern (sind doch die trainierbaren, oder?) noch ein Frage:

Wenn eine neue Spamwelle kommt, hab ich dann von so einem Filter
überhaupt was, wenn ich nicht `ständig' sondern nur z.B. wöchentlich
abhole? Ich würde erwarten, dass Spam beim Abholen durch den nicht
trainierten Filter fällt. Dann kann ich den zwar trainieren und er würde
neue Spam besser erkennen, aber da ist die ja schon komplett
einsortiert. Ist das so?

> "spam" sammle ich eher nur so zum Spaß. (Am Anfang ist das gut, den
> auch durchzugucken.)

nehme ich mir auch hin- und wieder mal vor und lasse es dann doch, wenn
ich diese Riesenfolder überhaupt mal aufmache...

> Kurzum: Alles, was in "spam-unsure" landet (oder generell am Anfang
> falsch erkannt worden war) kopier' ich in "sa-ham" bzw. "sa-spam". Von
> da grabbelt sich das Script da oben die Sachen dann via cron weg.
> (Locking hab' ich mir hier erspart.)

wieviel Zeit dauert das so am Tag? Du musst nur die nicht-Spam aus dem
Folder per Hand einsortieren (das sollte ja eher wenig sein, richtig?)
und den Rest in den anderen Folder kopieren, richtig?

> > Wieviel liegt `unsure' hast Du so?
> 
> Das sind dann nur noch 'nen paar dutzend am Tag. Aber ich kann mal ein
> paar Tage lang auch wirklich nachzählen. Ist jedenfalls übersichtlich.

na ja, schwankt ja bestimmt eh ziemlich. Paar Dutzend per Hand pro Tag
fänd ich aber schon nervig, muss ich zugeben. Gut, auf Arbeit macht mir
das nichts, aber privat wo ich normalerweise (bis auf jetzt im Urlaub,
da wars natürlich nicht schlimm) nur einmal die Woche oder so gucke und
dann wären dass ja schon 250 Mails, die ich anfassen muss... da würde
ich bestimmt doch wieder welche zuviel löschen - ich mein, ich kriege
Mails mit Subjekt 'hallo' oder ähnlich genau mit Foto-Anhang - das sind
dann Börsenspielspams oder Handyfotos von Bekannten, kann ich als Mensch
kaum auseinanderhalten (vielleicht hätte das auch Vorteile :->)

> Was auch *tüchtig* Punkte grbracht hat, ist, daß ich auf lug-owl.de
> noch postgrey installiert hab'.  Das hat das initials Spam-Aufkommen
> gefühlt locker halbiert.

Ja, das hat bei mir auch kräftig was gebracht. Es war fast `Spam
ausschalten'. Aber funktioniert heute auch nicht mehr sooo gut, die
Spammer lernen auch dazu...

> Nur sind die Adressen, zumindest dem Namen nach, in 2010 nicht mehr
> funktional...  Das wird dann ggf. noch ganz anders ärgern.

ach so, ich verstehe... Also die Funktion ist nur, die Filter zu
überspringen. Ich gebe aber zu, dass ich hoffe, dass die Mailaddressen
nun nicht unbedingt in die Addressbücher wandern. Viele gehen mit
Mailaddressen auch etwas `sorgloser' um und suchen sich immer die lezte
Mail zum Antworten raus. Die anderen nutzen Reply-To: oder gehen richtig
um, nutzen dann aber steffen@ aus dem Addressbuch. validto-20080218
sollte übrigens schon in 6 Wochen nicht mehr funktional (priviligiert)
sein. Vielleicht hätte ich statt  validto priviledgeduntil schreiben
sollen aber ist ja noch länger...

> Auf der anderen Seite: Du wirst nicht verhindern können, auch mal
> Nicht-Spam-Mails zu entsorgen. Das liegt einfach in der Natur der
> Dinge... 

ja leider... Aber das ist mir immer peinlich, auch weil es (mir) wohl
besonders gern bei Leuten passiert, die eher selten schreiben. Es gibt
ja nichtmal ne bounce! (zu bouncen statt zu löschen war ne Idee, die ich
schlimmer fand, kann noch mehr noch schlimmer schiefgehen, vor allem,
weil From etc. bei wirklichen Spam ja eh gefälscht ist).

Das Problem ist ja, dass man es nicht merkt, der/die andere vergisst es
dann oder ärgert sich, schreibt nicht gleich oder gar nicht nochmal ...
naja Schade sowas.

Ja, leider ist E-Mail nicht wirklich zuverlässig, leider nimmt darauf
(noch?) nicht jeder `Rücksicht' (z.B. wöchentlich Mail neusenden, bis
Antwort kommt oder sowas, ja wie auch).

> Ansonsten hilft nur viel Einsatz und die Hoffnung, daß sich Spam
> irgendwann mal nicht mehr trägt. Oder, daß es eine technische Lösung
> für das Problem gibt (was ich eher nicht glaube.)

ich fürchte, Du hast Recht :(

oki,

Steffen

-- 
Dieses Schreiben wurde maschinell erstellt,
es trägt daher weder Unterschrift noch Siegel.




Mehr Informationen über die Mailingliste linux-l