[linux-l] Re: OT: Mailarchiv HTTPS?...

Oliver Bandel oliver at first.in-berlin.de
Di Feb 6 21:28:26 CET 2007


Moin,


On Tue, Feb 06, 2007 at 03:52:08PM +0100, Lutz Willek wrote:
> Hier die Antwort:
> 
> 
> Hallo Lutz, hallo Pinguine,
> am Tue, 06.02.2007 um  1:22 h +0100 schriebst Du:
> 
> >> auf Linux-L geht es gerade um die Mailinglisten- Suchfunktion.
> >>[...]
> 
> Es gibt eine Menge TODOs für Mailinglisten.
> 
> Umzug auf einen neuen Server....
> 
> ...Damit sollte das Archiv wieder monatsweise
> (oder, falls linux-l so sehr "brummt", auch wochenweise) angezeigt
> werden. Gleichzeitig (ist aber eher auf anderen Listen Thema) werden
> Anhänge im Archiv zugänglich.
[...]


Wenn das eh vorgesehen ist, monatliche oder wochen-bezogene
Anzeige bereit zu stellen, dann sollte das Problem
mit dem langsamen Zugriff ja in Kürze erledigt sein?


 
[...]
> [Durchsuchbarkeit des Archives]
> >> Oh ja, mich nervt das auch. Ich durchsuche das Archiv auch nur noch
> >> mit google, alles andere ist nicht zumutbar.
> 
> An deren Indizierungsleistung werden wir wohl nie rankommen.
> 

Auf dem eigenen Server sehr wohl.
Oder willst Du mir weiss machen,
daß Google den eigenen Rechner/das eigene Mailarchiv
besser indizieren kann als der rechnerbtreiber selbst?

(Dann braucht Schnüffl-Schäuble ja bloß nen Browser
 und keine kriminelle Energie, wie er sie bis jetzt noch
 an den Tag legt....)

Es gibt sehr wohl sehr gute Web-Indizierer.

Aber so weit braucht man garnicht gehen, wenn die Daten
(steht ja weiter unten) eh in mbox-Files vorliegt.

Also kann man das doch wunderbar bearbeiten :)



[...]
> >>>> Wie ist die Schnittstelle, die uns von dem derzeit laufenden
> >>>> Mailinglisten-Progrämmchen angeboten wird?
> >>>> File-based? oder Datenbank?
> 
> Jede Mail wird bei Ankunft ins Archiv eingefügt, da muß jedesmal nur
> wenig HTML neu generiert werden. Das Archiv liegt intern auch als mbox
> file vor.
[...]

Ooh, what a simple task. :)

Mbox-Format ist so wunderbar einfach.
Das lässt sich doch ohne großen Aufwand verwerten. :)


> 
> Die Default-Schnittstelle ist aber SMTP mit Datenübergabe nach RFC2882
>  ;-)

wenn's lokal auf'm Server liegt, bleibts einfach,
ansonsten mussman halt noch smtp machen.
Letzteres geht doch aber sicherlich mit reichlich vorhandenen
Tools.


> [...]
> 
> > > Ich leite Deine Mail mal weiter, eventuell kann man da was machen.
> > > Schön wäre es zumindest.
> 
> Ist angekommen. Abgesehen von möglichen und vielleicht auch sinnvollen
> externen Lösungen kann ich Euch aber im Moment nur um Geduld bitten.

mbox parsen, in Worte splitten, Index-DB anlegen mit Verweis
auf die Mail, in der das Wort gefunden wurde...

...dann bei Suche nach Stichwort, eben selbes im Index suchen und alle
passenden mails ausgeben.

Evtl. (Thread-Anzeige) dann via Mail-Header die Vernetzung ermitteln;
MSG-ID in zweite Index-DB.

Das ist schon mal das Prinzip.
Und dann noch etwas HTML drum herum.

Kann doch alles kein Drama sein. ;-)

Gruß,
   Oliver



Mehr Informationen über die Mailingliste linux-l