我看过很多关于 XML 比较的帖子,但我看过的没有一个能解决我的问题。
我们有一些 XML 格式的文本文档(产品描述,带有标题和段落)正在更新(即版本化),我的任务是制作变更摘要。也就是说,我们想要获取两个连续的文件并生成第三个;标题结构(大纲)要保留,但只保留有变化的段落——添加和删除都应该标记出来。
因此,我一直在尝试找到一种方法来遍历 DOM 树并检测添加和删除,但我在可靠地检测它们时遇到了问题。显然,这是因为我应该进行比较 - 但我不能使用普通的比较,因为我想在每个元素内进行单独的比较,并且因为我无法使用传统的比较结果,但需要有一个完全格式化的 xml消化。
在我尝试解决“最长公共子序列问题”之前有什么提示吗?这将是一项艰巨的任务?
我建议使用 XMLUnit 作为差分引擎。它提供了使用您自己的能力差异监听器 http://xmlunit.sourceforge.net/api/index.html每当两个节点不同时就会收到通知。在处理程序中,您可以将适当的 DOM 节点添加到目标文档中。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)