[linux-l] Tool fuer Paragraphen

Peter Ross Peter.Ross at alumni.tu-berlin.de
So Dez 23 06:58:53 CET 2007


On Sat, 22 Dec 2007, Ivan F. Villanueva B. wrote:

> Hallo,
> ich habe linkchecker gerade ausprobiert. Er spuckt so etwas wie:
> 
> ----
> URL        `/Berliner_Buero' (cached)
> Name       `Berliner Büro'
> Parent URL http://www.ffii.de/index.html, line 24, col 5
> Real URL   http://www.ffii.de/Berliner_Buero
> Info       Redirected to http://www.ffii.de/Berliner_Buero/.
> Warning    HTTP 301 (moved permanent) encountered: you should
>            update this link.
> Result     Valid: 200 OK
> 
> URL        `http://www.ffii.org.uk/' (cached)
> Name       `Großbritannien'
> Parent URL http://www.ffii.de/Berliner_Buero/, line 89, col 13
> Real URL   http://www.ffii.org.uk/
> Result     Error: (111, 'Connection refused')
> ----
> 
> Jetzt frage ich mich, mit welchen Tools solche Sachen zu bearbeiten sind.
> Ich möchte nur die URLs haben, die nicht "Valid" sind.
> Mit Vim scheint mir etwas umständlich: :%s/^URL\s`\(.*\)' ...
> Was soll ich lernen, um solche Sachen effektiv zu machen?
> awk? sed?

Generell benutze ich awk sehr gern, wenn ich gut trennbare Felder habe 

nutze oft sed fuer kleine Ersetzungen (aehnlich derer, die Du im vim 
machen wolltest), 

da ich mit regulareren Ausdruecken und awk nicht so recht warm geworden 
bin,

und perl, wenn ich das Gefuehl habe, es artet in richtige Programmierung 
aus.

Obiges waere vielleicht awk (Schnellschuss;-)
awk '{if ($1=="Real" && $2=="URL") URL=$3; else if ($1=="Result") if 
($2!="Valid:") print URL}'

Gruss
Peter


Mehr Informationen über die Mailingliste linux-l