有一个xml文件:
<body>
<entry>
I go to <hw>to</hw> to school.
</entry>
</body>
由于某种原因,我改变了<hw>
to <hw>
and </hw>
to </hw>
在使用 lxml 解析器解析它之前。
<body>
<entry>
I go to <hw>to</hw> to school.
</entry>
</body>
但是修改解析的xml数据后,我想得到一个<hw>
元素,不<hw>
。我怎样才能做到这一点?
首先找到一个unescape
功能:
from xml.sax.saxutils import unescape
entry=body[0]
取消转义并将其替换为原来的:
body.replace(entry, e.fromstring(unescape(e.tounicode(entry))))
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)