[linux-l] Spam-Sortiererei (was: Embbeded Computer als CD-/MP3-Player im Netzwerk)

Jan-Benedict Glaw jbglaw at lug-owl.de
Di Jan 8 01:59:32 CET 2008


On Tue, 2008-01-08 00:11:05 +0100, Steffen Dettmer <steffen at dett.de> wrote:
> * Jan-Benedict Glaw wrote on Mon, Jan 07, 2008 at 08:49 +0100:
> > > > > Aber dann braucht man doch noch einen Rechner, wo das pulseaudio drauf
> > > > > läuft, oder?
> > > > 
> > > > Jein. Du brauchst ein Programm, daß die PA-Client-Library benutzt.
> > > > 
> > > > Wenn man z.B. die MP3-Datei nach stdout "entpackt" und von da aus
> > > > pacat (als PulseAudio-Client) benutzt, tut das schon.
> > > 
> > > Für das Entpacken von MP3 nach stdout braucht man doch genausoviel CPU
> > > wie zum Entpacken von MP3 nach /dev/dsp0 (oder was man da hat)?
> > 
> > Wenn man das auf einem *fremden* Rechner macht, dann nicht.
> 
> OK, dann braucht man eben doch noch einen *fremden* Rechner...  (?!)

Klar! Aber ich hatte die initiale Frage sowieso so verstanden, daß die
Musik von einem weiteren Rechner kommt und nur auf dem Ding
ausgewählt bzw. dann hörbar gemacht wird.

> > > ok. Hast Du Informationen / Links zu dem Thema, warum/wann
> > > Wegwerf-Adressen Nachteile haben und welche? Mit google finde ich
> > > leider nicht wirklich was (was an meinen schlechten Suchbegriffen
> > > liegt?).
> > 
> > Sie haben den Nachteil, daß, wenn ich so'ne Mail in 5 Jahren finde,
> > ich nicht mehr direkt an den Schreiberling herantreten kann.
> 
> Ach so, nee, man kann die weiterhin nutzen, dann werden die Mails bloss
> `normal' behandelt und durch den Spamfilter ausgeliefert (wenn nicht
> gerade explizit geblockt). Die Addressen sind also weiterhin gültig, nur
> gehen nicht mehr am (zweiten) Spamfilter und scoring vorbei sondern
> müssen da ganz normal durch (postgrey läuft auch, aber das ist ja
> sozusagen eine andere Ebene). Die sind dann nach meiner aktuellen
> Vorstellung wie eine Mail an steffen at . 

D.h. Du hast 'nen catch-all für all die alten Adressen? Oder pflegst
Adreßlisten mit?

> > > d.h. bogofilter und Spamassin? Warum ist das besser als signierte
> > > Addressen und Spamfilter?
> > 
> > Signatur hin oder her: Auch ein Spam-Versender kann seine Mails
> > signieren. 
> 
> Mailsignatur ist ja egal, oder meinst Du so eine Addresse verwenden?

Nene, schon die Signatur. Wenn Du nur Mails mit Signatur annehmen
willst, dann wird demnächst halt Spam mit Signatur verschickt.

> > > (muss man bogofilter und Spamassin nicht auch konfigurieren und
> > > trainieren?)
> > 
> > Aber sicher.
> 
> na ja, macht ja aber auch ne Menge Arbeit (obwohl sich das nach eher
> wenig bzw. einer überschaubaren Menge anhört). 

Och, das geht. Jedenfalls deutlich weniger, als es früher[tm] Arbeit
war, das auseinanderzusortieren.

> Ich würde es bestimmt wieder schaffen, nicht-Spam falsch einzusortieren
> und damit Mails zu verlieren :(

Irren ist menschlich...

> Zu baynes-Filtern (sind doch die trainierbaren, oder?) noch ein Frage:
> 
> Wenn eine neue Spamwelle kommt, hab ich dann von so einem Filter
> überhaupt was, wenn ich nicht `ständig' sondern nur z.B. wöchentlich
> abhole? Ich würde erwarten, dass Spam beim Abholen durch den nicht

Nö. Ggf. bei Benutzung von externen Quellen, aber grundsätzlich laufen
die am besten, wenn sie eben zeitnah gefüttert werden.

Würd' ich nur wöchentlich durch die Mails gucken, dann könnte ich es
auch sein lassen. LKML und Co. erwarten da doch etwas mehr
Aufmerksamkeit :)

> trainierten Filter fällt. Dann kann ich den zwar trainieren und er würde
> neue Spam besser erkennen, aber da ist die ja schon komplett
> einsortiert. Ist das so?

Jup. Das Ding kann nur urteilen über Mails, wenn er schon was gelernt
hat.

> > "spam" sammle ich eher nur so zum Spaß. (Am Anfang ist das gut, den
> > auch durchzugucken.)
> 
> nehme ich mir auch hin- und wieder mal vor und lasse es dann doch, wenn
> ich diese Riesenfolder überhaupt mal aufmache...

Naja, sind wohl so um die 100MB/Monat, und das *nach* postgrey.

> > Kurzum: Alles, was in "spam-unsure" landet (oder generell am Anfang
> > falsch erkannt worden war) kopier' ich in "sa-ham" bzw. "sa-spam". Von
> > da grabbelt sich das Script da oben die Sachen dann via cron weg.
> > (Locking hab' ich mir hier erspart.)
> 
> wieviel Zeit dauert das so am Tag? Du musst nur die nicht-Spam aus dem
> Folder per Hand einsortieren (das sollte ja eher wenig sein, richtig?)
> und den Rest in den anderen Folder kopieren, richtig?

Ich tag'ge alle Spam-Mails, Tag'kopier' die nach sa-spam, verschieb'
sie nach realspam, folder write-out, und widme mich dann dem Rest.
Kopieren nach sa-ham und dann einsortieren in die eigentlichen
Ziel-Folder.

Mail-Lesen mach' ich immer wieder mal am Tag. Bei mir geht ja auch
richtig was durch. Ich glaub', ich will garnicht wissen, *wie* lange
ich da für täglich (und nächtlich) sitze...

> > > Wieviel liegt `unsure' hast Du so?
> > 
> > Das sind dann nur noch 'nen paar dutzend am Tag. Aber ich kann mal ein
> > paar Tage lang auch wirklich nachzählen. Ist jedenfalls übersichtlich.
> 
> na ja, schwankt ja bestimmt eh ziemlich. Paar Dutzend per Hand pro Tag
> fänd ich aber schon nervig, muss ich zugeben. Gut, auf Arbeit macht mir
> das nichts, aber privat wo ich normalerweise (bis auf jetzt im Urlaub,
> da wars natürlich nicht schlimm) nur einmal die Woche oder so gucke und
> dann wären dass ja schon 250 Mails, die ich anfassen muss... da würde
> ich bestimmt doch wieder welche zuviel löschen - ich mein, ich kriege
> Mails mit Subjekt 'hallo' oder ähnlich genau mit Foto-Anhang - das sind
> dann Börsenspielspams oder Handyfotos von Bekannten, kann ich als Mensch
> kaum auseinanderhalten (vielleicht hätte das auch Vorteile :->)

Erm...

Ich glaub', wir bekommen um Größenordnungen andere Mengen an
Nutz-Emails. Ich sprech' da von der Kategorie "wenige Tausend pro
Tag".

> > Was auch *tüchtig* Punkte grbracht hat, ist, daß ich auf lug-owl.de
> > noch postgrey installiert hab'.  Das hat das initials Spam-Aufkommen
> > gefühlt locker halbiert.
> 
> Ja, das hat bei mir auch kräftig was gebracht. Es war fast `Spam
> ausschalten'. Aber funktioniert heute auch nicht mehr sooo gut, die
> Spammer lernen auch dazu...

Jup. Aber wenns mir 'nen paar huntert Spam-Mails pro Tag erspart, hat
sich das schon gelohnt.

> > Nur sind die Adressen, zumindest dem Namen nach, in 2010 nicht mehr
> > funktional...  Das wird dann ggf. noch ganz anders ärgern.
> 
> ach so, ich verstehe... Also die Funktion ist nur, die Filter zu
> überspringen. Ich gebe aber zu, dass ich hoffe, dass die Mailaddressen
> nun nicht unbedingt in die Addressbücher wandern. Viele gehen mit
> Mailaddressen auch etwas `sorgloser' um und suchen sich immer die lezte
> Mail zum Antworten raus. Die anderen nutzen Reply-To: oder gehen richtig
> um, nutzen dann aber steffen@ aus dem Addressbuch. validto-20080218
> sollte übrigens schon in 6 Wochen nicht mehr funktional (priviligiert)
> sein. Vielleicht hätte ich statt  validto priviledgeduntil schreiben
> sollen aber ist ja noch länger...

Einfach weglassen. Das behindert doch nur andere in der Zukunft.

MfG, JBG

-- 
      Jan-Benedict Glaw      jbglaw at lug-owl.de              +49-172-7608481
  Signature of:                          Zensur im Internet? Nein danke!
  the second  :


Mehr Informationen über die Mailingliste linux-l