linux-l: Wo Tools ablegen?

Oliver Bandel oliver at first.in-berlin.de
Mo Mai 18 00:44:24 CEST 1998


Hallo!



On Sun, 17 May 1998, Mirko Dziadzka wrote:

> On Sun, May 17, 1998 at 04:30:05PM +0200, Dr. Bernd Freistedt wrote:
> > Hi Oliver,
> > 
> > >Das Tool sucht mir die Files raus, die mehrfach vorhanden sind.
> > >Es prüft zuerst, ob die Files die gleiche Größe haben. Wenn ja, dann
> > >wird der Inhalt (byteweise) verglichen. Sind zwei Dateien gleich,
> > >werden die Namen erst mal gemerkt. 
> 
> Hm, Aber braucht man dafuer extra ein Programm ?

Vielleicht ja.
Ich finde es sinnvoll.

> 
> Wofuer hat man den Unix-Werkzeugkasten:
>     find geht ueber alle Files, sum gibt mir fuer ein File eine
>     CRC Checksum.  Ich hab dann eine Datei mit Eintragen der Form
>     "CRC Filename" Mit sort kann man das File nach den CRC Eintragen
>     sortieren und am Ende liefert mir ein drei Zeilen awk-Script doppelte
>     CRC Eintrage.

Klar, sowas geht im Prinzip. Ich finde das Konzeot des Unix-Werkzeugkastens
ja auch sinnvoll und geradezu genial. Aber was sind denn diese Tools?
Programme.


Und Du kannst ja gerne die find/md5sum/awk-Lösung nehmen.

Jedoch:

- Erstens kann man bei dieser nicht ohne weiteres die Header überlesen. Das
  war aber sinnvolle Vorgabe, daß man das auch können soll.

- Zweitens: Nur find und sort haben bei einem eben erfolgten kleinen Test
            ca. 2 mal so lange gebraucht, wie mein Progrämmchen. Dabei muß
            man dem find und sort auch noch  den (ja auch nicht gerade sehr
            schnellen) awk hinten 'ran basteln. Und den Code meines
            Programms kann ich noch optimieren. (Und zwar bei einem
            Teilabschnitt des Programms, wo ich auf die Platte zugreife...
            ... das sollte also nochmal mächtig Zeit sparen können :-))


Was spricht dagegen, dem Unix-Werkzeugkasten ein weiteres Werkzeug
hinzu zufügen?


Tschüß,
    Oliver





Mehr Informationen über die Mailingliste linux-l