[linux-l] Wohin mit den alten Mails? mbox vs maildir

Oliver Bandel oliver at first.in-berlin.de
Di Mär 20 02:43:02 CET 2007


On Tue, Mar 20, 2007 at 12:35:38AM +0100, Sven Guckes wrote:
> * Volker Grabsch <vog at notjusthosting.com> [2007-03-19 13:53]:
> > @Sven: Das ganze müsste sich doch nochmal beschleunigen
> > lassen, wenn man mbox statt Maildir nimmt, oder?
> > Hattest du da mal Messungen gemacht?
> 
> meine mailboxen sind alle im mbox format.
> hatte das vergessen zu erwaehnen.
> 
> ich koennte natuerlich alle mailboxen nochmal in
> maildirs verwandelen und dann nochmal testen -
> aber ich fuerchte, dass dann dem dateisystem
> die inodes ausgehen.  und das gibt dann aerger.
> 
> die ganze diskussion ist eh tot.

Sehe ich auch so.


> wenn Oliver
> nicht bereit ist seinen eigenen ideen zu folgen,
> dann kommen wir hier einfach nicht weiter.

Ach, weisst Du.... ääähhhh, ich wurde ja öfters mal drauf angesprochen,
wie es denn konkret aussieht mit den Sachen, die ich hier
in theoretischer Weise erwähne, aber nicht praktisch umgesetzt habe
(mit Messungen belegt).

Da sind mehrere Gründe, wieso das nicht passierte.

1) Ich habe viele Ideen und lasse mich diesbezüglich dann
   zu sehr von neuen Sachen ablenken. Da viele Sachen zwar interessant,
   aber auch nicht wirklich wichtig sind, fange ich immer wieder neues Zeugs an.
   Das kann aber so nicht weiter gehen und ich will mich nun auf ein paar wenige
   Tools konzentrieren und die fertig stellen.

   Ich habe deshalb vor ein paar Tagen meine Programmier-Verzeichnisse aufgeräumt.
   Die zwei Haupt-Dirs habe ich "zusammengelegt" und dann mal angefangen
   auszusortieren, in Ablage-Verzeichnisse, was nicht so sehr wichtig war
   (oder zu grottig ;-)).
   Nachdem ich etliche Dirs umverschoben hatte und kein Ende sah, dachte ich mir,
   mal mit "ls | wc -l" zu schauen, wieviel da denn noch so rum liegt.
   93 Einträge waren es, obwol ich vorher schon einiges da weg geräumt hatte.
   Alles angefangene Sachen, die ich mal hätte umsetzen wollen.

   Nun habe ich also aufgeräumt, das wichtigste ins CVS eingecheckt
   und alles Andere einfach auf eine andre Platte a la "Ablage"
   (noch nicht ganz "Ablage P", aber fast ;-) dort aus meinem
   Blickfeld verbannt.

   Ich werde mich nun auf ein paar wenige Tools konzentrieren,
   diese neu schreiben bzw. bereits vorhandene Tools verbessern,
   sofern das notwenidig ist.

   Die Sache mit dem Wortindex war übrigens eine von vielen
   angefangenen Sachen. Das wollte ich wirklich mal bauen.
   Anderes Zeugs waren diverse Ansätze zu diversen anderen
   Themen; mal eine RegionAlgebra zu
   implementieren, SVMs zu implementieren, Tries, nntp-grabber,
   diverse weitere Tools usw.
   Der Alltag hat mich davon aber immer wieder abgebracht
   und da keine wirkliche Notwendigkeit da war (bzw. keiner,
   der das als Job bezahlt hätte) und mit der BeLUG nix a la
   Zusammenarbeit lief (siehe Punkt 2) blieb das meiste leider
   liegen.

   Die Flut an Ideen (oder, daß ich nicht oft genug aufräumte (FengShui;-)))
   war sicherlich ein weiterer Grund.


2) Ich hatte immer gehofft, via BeLUG mit Leuten gemeinsam an was zu arbeiten,
   Spaß beim gemeinsamen Programmieren zu haben.
   Das hat sich in 8 Jahren nicht erfüllt, und seit einigen Wochen sind meine
   Sachen von der BeLUG auf meinen Wunsch hin entfernt worden.

3) Die Diskussionen hier lenken mich auch ab; und bringen letztlich nichts,
   deswegen werde ich mich demnächst vermutlich wieder(mal) hier aus der Liste
   austragen.

   Dann habe ich mehr Ruhe, mal an meinen Tools - an der verkleinerten Auswahl -
   weiter zu bauen. Naja und arbeiten muss ja auch noch sein ;-)

   Wer will, kann sich das Zeugs dann ja mal auf meinen IN-Seiten
   anschauen.


> ich lass Oliver seine meinungen und kuemmere
> mich lieber um dinge, die mich weiterbringen.

Siehste, das geht mir nun genauso.
Und vielleicht baue ich so ein Tool noch,
das über mehrere mbox-Files indiziert
und damit ein schnelleres Suchen ermöglicht (muß also
nicht ein großes File sein, sondern kann auch verteilt sein...).

Aber im Moment habe ich andere Tools, die ich noch machen will.
"namealign" heisst das Ding, das ich schon seit langem mal bauen wollte,
und in den letzten Tagen habe ich mich da ab und zu mal dran gesetzt
und es ist bereits soweit, daß ich es bei mir zu Hause einsetze.
Aber ich muss noch CLI-Optionen einbauen, damit ich das Teil
flexibel nutzen kann. Und ich denke, daß ich in den nächsten Tagen
mal wieder dazu komme.
Das schwierigste ist dabei, eine sinnvolle Designentscheidung zu treffen.
Und dafür muss man erst mal herum probieren, was denn im Alltag,
wenn man so ein Tool benutzt, den besten *praktischen* *Nutzen*
hat. Einige Sachen, die ich erst vor hatte, haben sich als
weniger praktisch heraus gestellt und wenn ich weiss, welche Optionen ich brauche und
welche Defaults sinnvoll sind (ist auch persönlicher Geschmack, klar ;-))
dann baue ich das entsprechend zusammen.

Naja, lange Rede, kurzer Sinn: ich konzentriere mich dann mal
auf ein paar Tools, und wenn die fertig sind, kann ich mir wieder
andere vornehmen. Ob es aber das mbox-Teil sein wird, weiss ich nicht.
Wenn ja, wird es aber evtl. eine DSL ein, die ich mit meinem
mbox-Module verheirate, oder so. Oder eben auch nur ein simples
CLI-Tool.
Weiss nicht....
Ist jetzt auch erst mal egal, weil das noch nicht
akut ist. Will mich nicht wieder verzetteln (verFILEen ;-)).

Drum müsst Ihr Euch bzgl. der Ergebnisse der mboxerei-Indizierung
halt Geldulden, bis ich meine, es zu implementieren (oder jemand anderes
meint, das implementieren zu wollen (und auch zu tun;-))).

Grundsätzlich kann man sicherlich davon ausgehen, daß eine Index-Suche
schneller sein wird, als eine Volltextsuche. Aber ihr könnt das natürlich
so lange, wie ich das nicht im konkreten Falle der mbox-erei
auch nachgewiesen habe, weiterhin bezweifeln.
Mag ja sein, daß es Gründe gibt, die meinen Ansatz als Unsinnig
für die Alltagspraxis herausstellen und sich die erst im Rahmen
einer Implementierung zeigen.

Die Frage muss dann also erst mal unbeantwortet bleiben,
ob eine mbox-Indizierung Sinn macht. (Hängt aber sicherlich
auch davon ab, WIE man das indiziert und wie die vielen
Randbesdingungen sind usw.)
Jedenfalls wäre so ein Tool praktischer, als bei mehreren mbox-Files
mutt mehrfach aufzurufen. Und oberfette zig-zig-GB große mbox-Files
machen IMHO keinen Sinn.
Altes Zeug sollte man nicht unbedingt immer auf der Platte halten.




> 
> die meisten diskussionen sind hier eh nutzlos.

Stimmt leider.

Und deswegen habe iah auch keine Böcke mehr dadrauf.
Ist mir in den letzten Tagen wieder klar geworden.

Immerhin hatte ich in den Diskussionen mit Volker hin und wieder
den Eindruck, daß da Diskussionen auch fruchtbar sein können.
Aber das ist wohl eine der raren Ausnahmen.


> kein treffen von leuten, die mal gemeinsam
> einem thema nachgehen wollen,

Siehste, das ist es genau, was ich auch vermisste.
Vorträge sind zwar auch ganz nett, aber diesen Frontalunterricht
muss ich mir nicht wirklich rein ziehen. Gemeinsam an was arbeiten
kann viel Spaß machen. Aber sowas wie "bau Du das mal und sag uns,
ob das klappt", das finde ich nicht wirklich den Knaller.


> keine doku
> (und seien es auch nur zusammenfassungen),
> und einfach keine vortraege darueber fuer
> diejenigen, die sich trotzdem interessieren.
> 
> ich fuerchte aus dieser belug wird nie
> was werden.  alles nur heisse luft hier.

Stimmt.

Ich habe meine Konsequenzen gezogen.
Ich habe, wie oben bereits erwähnt, meine ganzen Sachen
von der BeLUG entfernen lassen. Und werde wohl hier auch bald aus der Liste raus gehen.

Falls es irgendwen interessiert, meine Sachen liegen jetzt
nur noch auf den IN-Servern, also den Servern,
die der IN für die User bereit stellt.

Da ist das Zeugs:
  http://me.in-berlin.de/~first/


Gruß,
   Oliver



Mehr Informationen über die Mailingliste linux-l