SAXReader 不重新转义字符

2024-04-21

我正在使用 dom4j 读取 XML 文件。该文件如下所示:

...
<Field>&#13;&#10; hello, world...</Field>
...

我用以下方式读取文件SAXReader into a Document。当我使用getText()在节点上我获得以下字符串:

\r\n hello, world...

我做了一些处理,然后使用写入另一个文件asXml()。但这些字符并未像原始文件中那样进行转义,这会导致使用该文件的外部系统出现错误。

我怎样才能逃脱特殊字符并拥有&#13;&#10;写入文件时?


你不能轻易。这些不是“逃避”,而是“角色实体”。它们是 XML 的基本组成部分。 Xerces 对“未解析实体”有一些非常复杂的支持,但我怀疑它是否适用于这些实体,而不是 DTD 中定义的种类。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

SAXReader 不重新转义字符 的相关文章

随机推荐