用Python正则替换HTML中pre标签里面的特殊符号

就是把pre标签里面的特殊符号(< > & ' ")替换成对应的字符实体(code标签不用替换)。

请问用Python的re正则替换应该怎么写?

谢谢!!
我是说只替换pre标签里面的特殊符号,不是整个HTML文档都替换。
例如:
<html>
<body>
<pre>
<code>
<div>div</div>
</code>
</pre>
<hr>
<pre>
<span>span</span>
</pre>
</body>
</html>
实际情况下不一定有多少个pre,需要用正则把pre标签包裹的(不包括code标签)特殊符号进行替换。其他的不要替换。

一共就7个符号,就写7行替换吧。

用不用正则无所谓,不多。

不用正则也行,网页parse后,innerText输出的就是正常文本,innerHtml输出的才是你说的这种有特殊符号的内容。

温馨提示:答案为网友推荐,仅供参考
相似回答