linux-l: Removing HTML tags with "sed"

Andreas Kotes count at linux.de
Do Aug 27 12:49:18 CEST 1998


On Thu, 27 Aug 1998, Dr. Bernd Freistedt wrote:

> At 12:11 27.08.1998 +0200, you wrote:
> >Quoting Dr. Bernd Freistedt (bernd.freistedt at charite.de):
> >> >> 	cat pipapo.html | sed -e s/<.*>//g
> >> >Nun, das ".*" ist ein bischen *zu* einfach gewaehlt -
> >> Noe, noe, da sind auch die "<" und ">" drin, also: "<.*>"
> >> >Dieser Ausdruck entfernt nicht nur tags, sondern auch Text dazwischen.
> >> Bist Du sicher? ;-O
> >
> >Ziemlich sicher.  Aber das kann man ja mal einfach testen:
> >	$ echo "foo <b>and</b> bar" | sed -e "s/<.*>//"
> >	foo  bar
> >
> >	$ echo "foo <b>and</b> bar" | gsed -e "s/<.*>//"
> >	foo  bar
> >
> >Kommt bei Euch was anderes raus?
> 
> Ooooh, Mist ..... 
> .... puuuuuuh

Ach Kinners ...

  $ echo "foo <b>and</b> bar" | sed -e "s/<[^>]*>//g"
  foo and bar

*wink*

  der Count






Mehr Informationen über die Mailingliste linux-l