linux-l: Removing HTML tags with "sed"

Dr. Bernd Freistedt bernd.freistedt at charite.de
Do Aug 27 12:37:24 CEST 1998


At 12:11 27.08.1998 +0200, you wrote:
>Quoting Dr. Bernd Freistedt (bernd.freistedt at charite.de):
>> >> 	cat pipapo.html | sed -e s/<.*>//g
>> >Nun, das ".*" ist ein bischen *zu* einfach gewaehlt -
>> Noe, noe, da sind auch die "<" und ">" drin, also: "<.*>"
>> >Dieser Ausdruck entfernt nicht nur tags, sondern auch Text dazwischen.
>> Bist Du sicher? ;-O
>
>Ziemlich sicher.  Aber das kann man ja mal einfach testen:
>	$ echo "foo <b>and</b> bar" | sed -e "s/<.*>//"
>	foo  bar
>
>	$ echo "foo <b>and</b> bar" | gsed -e "s/<.*>//"
>	foo  bar
>
>Kommt bei Euch was anderes raus?

Ooooh, Mist ..... 
.... puuuuuuh

Gruessli 
Bernd




Mehr Informationen über die Mailingliste linux-l