linux-l: LaTeX-nach-MSWord-Konvertierung (auch HTML)

Sven Guckes guckes at math.fu-berlin.de
Do Aug 27 11:17:46 CEST 1998


Quoting Dr. Bernd Freistedt (bernd.freistedt at charite.de):
> a) wenn ich aus HTML's die Tags entfernen will
> 	cat pipapo.html | sed -e s/<.*>//g

Nun, das ".*" ist ein bischen *zu* einfach gewaehlt -
schliesslich wird immer der groesste match benutzt.
Und das will man nicht.  Beispiel:

	vorher:		Dieser Text ist <b>nicht</b> gut.
	nachher:	Dieser Text ist gut.

Zusammenfasssung:
Dieser Ausdruck entfernt nicht nur tags, sondern auch Text dazwischen.

Sven




Mehr Informationen über die Mailingliste linux-l