linux-l: Removing HTML tags with "sed"
Andreas Kotes
count at linux.de
Do Aug 27 12:49:18 CEST 1998
On Thu, 27 Aug 1998, Dr. Bernd Freistedt wrote:
> At 12:11 27.08.1998 +0200, you wrote:
> >Quoting Dr. Bernd Freistedt (bernd.freistedt at charite.de):
> >> >> cat pipapo.html | sed -e s/<.*>//g
> >> >Nun, das ".*" ist ein bischen *zu* einfach gewaehlt -
> >> Noe, noe, da sind auch die "<" und ">" drin, also: "<.*>"
> >> >Dieser Ausdruck entfernt nicht nur tags, sondern auch Text dazwischen.
> >> Bist Du sicher? ;-O
> >
> >Ziemlich sicher. Aber das kann man ja mal einfach testen:
> > $ echo "foo <b>and</b> bar" | sed -e "s/<.*>//"
> > foo bar
> >
> > $ echo "foo <b>and</b> bar" | gsed -e "s/<.*>//"
> > foo bar
> >
> >Kommt bei Euch was anderes raus?
>
> Ooooh, Mist .....
> .... puuuuuuh
Ach Kinners ...
$ echo "foo <b>and</b> bar" | sed -e "s/<[^>]*>//g"
foo and bar
*wink*
der Count
Mehr Informationen über die Mailingliste linux-l