linux-l: Wo Tools ablegen?
Oliver Bandel
oliver at first.in-berlin.de
Mo Mai 18 00:44:24 CEST 1998
Hallo!
On Sun, 17 May 1998, Mirko Dziadzka wrote:
> On Sun, May 17, 1998 at 04:30:05PM +0200, Dr. Bernd Freistedt wrote:
> > Hi Oliver,
> >
> > >Das Tool sucht mir die Files raus, die mehrfach vorhanden sind.
> > >Es prüft zuerst, ob die Files die gleiche Größe haben. Wenn ja, dann
> > >wird der Inhalt (byteweise) verglichen. Sind zwei Dateien gleich,
> > >werden die Namen erst mal gemerkt.
>
> Hm, Aber braucht man dafuer extra ein Programm ?
Vielleicht ja.
Ich finde es sinnvoll.
>
> Wofuer hat man den Unix-Werkzeugkasten:
> find geht ueber alle Files, sum gibt mir fuer ein File eine
> CRC Checksum. Ich hab dann eine Datei mit Eintragen der Form
> "CRC Filename" Mit sort kann man das File nach den CRC Eintragen
> sortieren und am Ende liefert mir ein drei Zeilen awk-Script doppelte
> CRC Eintrage.
Klar, sowas geht im Prinzip. Ich finde das Konzeot des Unix-Werkzeugkastens
ja auch sinnvoll und geradezu genial. Aber was sind denn diese Tools?
Programme.
Und Du kannst ja gerne die find/md5sum/awk-Lösung nehmen.
Jedoch:
- Erstens kann man bei dieser nicht ohne weiteres die Header überlesen. Das
war aber sinnvolle Vorgabe, daß man das auch können soll.
- Zweitens: Nur find und sort haben bei einem eben erfolgten kleinen Test
ca. 2 mal so lange gebraucht, wie mein Progrämmchen. Dabei muß
man dem find und sort auch noch den (ja auch nicht gerade sehr
schnellen) awk hinten 'ran basteln. Und den Code meines
Programms kann ich noch optimieren. (Und zwar bei einem
Teilabschnitt des Programms, wo ich auf die Platte zugreife...
... das sollte also nochmal mächtig Zeit sparen können :-))
Was spricht dagegen, dem Unix-Werkzeugkasten ein weiteres Werkzeug
hinzu zufügen?
Tschüß,
Oliver
Mehr Informationen über die Mailingliste linux-l