[linux-l] Tool fuer Paragraphen
Peter Ross
Peter.Ross at alumni.tu-berlin.de
So Dez 23 06:58:53 CET 2007
On Sat, 22 Dec 2007, Ivan F. Villanueva B. wrote:
> Hallo,
> ich habe linkchecker gerade ausprobiert. Er spuckt so etwas wie:
>
> ----
> URL `/Berliner_Buero' (cached)
> Name `Berliner Büro'
> Parent URL http://www.ffii.de/index.html, line 24, col 5
> Real URL http://www.ffii.de/Berliner_Buero
> Info Redirected to http://www.ffii.de/Berliner_Buero/.
> Warning HTTP 301 (moved permanent) encountered: you should
> update this link.
> Result Valid: 200 OK
>
> URL `http://www.ffii.org.uk/' (cached)
> Name `Großbritannien'
> Parent URL http://www.ffii.de/Berliner_Buero/, line 89, col 13
> Real URL http://www.ffii.org.uk/
> Result Error: (111, 'Connection refused')
> ----
>
> Jetzt frage ich mich, mit welchen Tools solche Sachen zu bearbeiten sind.
> Ich möchte nur die URLs haben, die nicht "Valid" sind.
> Mit Vim scheint mir etwas umständlich: :%s/^URL\s`\(.*\)' ...
> Was soll ich lernen, um solche Sachen effektiv zu machen?
> awk? sed?
Generell benutze ich awk sehr gern, wenn ich gut trennbare Felder habe
nutze oft sed fuer kleine Ersetzungen (aehnlich derer, die Du im vim
machen wolltest),
da ich mit regulareren Ausdruecken und awk nicht so recht warm geworden
bin,
und perl, wenn ich das Gefuehl habe, es artet in richtige Programmierung
aus.
Obiges waere vielleicht awk (Schnellschuss;-)
awk '{if ($1=="Real" && $2=="URL") URL=$3; else if ($1=="Result") if
($2!="Valid:") print URL}'
Gruss
Peter
Mehr Informationen über die Mailingliste linux-l