linux-l: ab URL alle lokalen Dokumente saugen
Marc Ende
marcende at zedat.fu-berlin.de
Mo Jul 27 03:40:21 CEST 1998
On Mon, 27 Jul 1998, Oliver Bandel wrote:
> > > Ich will alle lokalen Dokumente ab einer URL abwärts
> > > saugen.
> > > Es soll nicht nach den Links im Dokument weiter gesucht
> > > werden (wie bei wget), sondern es sollen nur die Files,
> > > die ab einer URL lokal auf dem Server liegen, gezogen
> > > werden.
> > mit wget :)) also: bei http geht's eben nicht, da du da nicht den
> > verseichnissinhalt abfragen kannst, es sei denn der server erlaubt
> > dies,
>
>
> ???
>
> Wie jetzt.?
>
> Man kann bei HTML keinen ls-Befehl verschicken, wie bei ftp?
Nö... :)
>
> Und deswegen gehts mit wget nicht? Und wenn der Server es doch erlaubt?
> (Also gibt es doch einen ls-Befehl im HTML-Stanbdard?)
Hat nix mit HTML zu tun... Der http läßt dies meines erachtens nicht zu.
Die Dokumente werden schließlich über ein einfaches Get geholt. Falls man
da zufällig nen Listing bekommt, welches die Filestruktur anzeigt, hat man
es mit einem lumpigen webdesigner oder admin zu tun...
Zumal es eigentlich auch nicht gewollt ist, die Verzeichnisstruktur
offenzulegen...
> Wenn ich den HTML-Server direkt anspreche, dann müßte ich mich
> doch an den Ausgaben entlang hangeln können?
>
> Also: Wenn ich mit dem Webbrowser von einer Stelle an die andere
> micgh Klicke, dann sehe ich doch die Links, die ich mir holen
> kann. Das ganze soll automatisiert werden.
Was wget ja auch macht, es werden die Links ausgewertet, damit hat dann
der Server mehr oder weniger nix zu tun (außer die Dokumente
herauszugeben).
> Das Problem das ich hatte war ja, daß mir wget eben einige Dokumente
> NICHT besorgen konnte, die ich mir mit lynx aber von Hand ziehen
> konnte. Das muß sich doch automatisieren lassen.
Was sollten denn das Für Dokumente sein (MIME-Typ) ? Bei CGIs kann man
unter umständen auf die kleine Nebensächlichkeit stoßen, daß da ne eingabe
gefordert wird. (Teilweise unterstützt das ja wget)
Marc
Mehr Informationen über die Mailingliste linux-l