[linux-l] URL-Regexp

Oliver Bandel oliver at first.in-berlin.de
Sa Feb 22 11:56:38 CET 2003


On Sat, Feb 22, 2003 at 11:06:12AM +0100, Philipp Grau wrote:
> Hallo,
> 
> * Oliver Bandel <oliver at first.in-berlin.de> [22.02.03 10:56]:
> > hat ma gerade jemand ne URL-Regexp in Perl- oder
> > Emacs-Style da?
> 
> Ich hätte da im Angebot:
> 
> http://www.perldoc.com/perl5.6/pod/perlfaq9.html#How-do-I-extract-URLs-

Ach so, FAQ. Na gut, habe dann gerade mal in perlfaq9 rein
geschaut.

Vielleicht bringt das was.

Ich hatte nämlich in einem meiner älteren Scripte zur Aufbereitung
der URL einen 4-Zeiler genommen, und das schien mir irgendwie
zu lang. Ausserdem hatte der manchmal - in seltenen Fällen -
auch Probleme gemacht.


Ich brauche aber eigentlich eh Emacs-Style.
wenn ich das richtig sehe, muß ich dann 
halt bloß die Grouping-Klammern backslashen, oder?



BTW, da fällt mir ein: Müsste sowas nicht vom www-Consortium
in irgend einem der vielen Dolumente festgelegt sein, wie
so eine URL *korrekt* aufgebaut ist?
Ich muss allerdings auch nicht ganz korrekte URLs erkennen.

Das bisherige Script tut's auch in den meisten Fällen, aber
manchmal eben auch nicht.


Ach so, in der Perlfaq steht was von "quick, imperfect",
hmhh, imperfect und quick ist meine Lösung auch.
Aber da ist 'n Link auf eine slow-and-perfect-solution.

Naja, quick-and-perfect wäre mir natürlich lieber. ;-)


Danke für dieLinks,
Werde ich mal durchbrowsen.


Ciao,
   Oliver




Mehr Informationen über die Mailingliste linux-l