使用dom java解析xml

2023-12-11

我有以下 xml：

<modelingOutput>
    <listOfTopics>
        <topic id="1">
            <token id="354">wish</token>
        </topic>
    </listOfTopics>
    <rankedDocs>
        <topic id="1">
            <documents>
                <document id="1" numWords="0"/>
                <document id="2" numWords="1"/>
                <document id="3" numWords="2"/>
            </documents>
        </topic>
    </rankedDocs>
    <listOfDocs>
        <documents>
            <document id="1">
                <topic id="1" percentage="4.790644689978203%"/>
                <topic id="2" percentage="11.427632949428334%"/>
                <topic id="3" percentage="17.86913349249596%"/>
            </document>
        </documents>
    </listOfDocs>
</modelingOutput>

想要解析这个xml文件并得到topic id and 百分比 from 文档列表

第一种方法是从 xml 获取所有文档元素，然后检查祖父节点是否为 ListofDocs。但元素文档存在于排名文档 and in 文档列表，所以我有一个非常大的清单。

所以我想知道是否存在更好的解决方案来解析此 xml 避免 if 语句？

My code:

public void parse(){
    Document dom = null;
    DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
    DocumentBuilder db = dbf.newDocumentBuilder();
    InputSource is = new InputSource(new StringReader(xml));

    dom = db.parse(is);

    Element doc = dom.getDocumentElement();
    NodeList documentnl = doc.getElementsByTagName("document");
    for (int i = 1; i <= documentnl.getLength(); i++) {
        Node item = documentnl.item(i);
        Node parentNode = item.getParentNode();
        Node grandpNode = parentNode.getParentNode();
        if(grandpNode.getNodeName() == "listOfDocs"{
            //get value
        }
    } 
}

首先，在检查节点名称时不应进行比较Strings using ==。始终使用equals方法代替。

您可以使用 XPath 仅评估文档topic下的元素listOfDocs:

XPathFactory xPathFactory = XPathFactory.newInstance();
XPath xPath = xPathFactory.newXPath();
XPathExpression xPathExpression = xPath.compile("//listOfDocs//document/topic");

NodeList topicnl = (NodeList) xPathExpression.evaluate(dom, XPathConstants.NODESET);
for(int i = 0; i < topicnl.getLength(); i++) {
   ...

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

xml

DOM

使用dom java解析xml 的相关文章

是什么决定了从 lambda 创建哪个函数式接口？

请考虑这个例子 import java util function Consumer public class Example public static void main String args Example example new
如何将 XML 文档嵌入到 XHTML 文档中？

例如我如何嵌入
正则表达式拆分数字和字母组，不带空格

如果我有一个像 11E12C108N 这样的字符串它是字母组和数字组的串联如何在中间没有分隔符空格字符的情况下分割它们例如我希望分割结果为 tokens 0 11 tokens 1 E tokens 2 12 tokens 3 C
OSGi：如果不取消服务会发生什么

这是我获取 OSGi 服务的方式 ServiceReference reference bundleContext getServiceReference Foo class getName Foo foo Foo bundleContex
wait() 在游戏中如何工作？

在 playframework 的文档中here http www playframework org documentation 1 2 1 asynchronous已写 public static void loopWithoutBlo
在 S3 中迭代对象时出现“ConnectionPoolTimeoutException”

我已经使用 aws java API 一段时间了没有遇到太多问题目前我使用的是库 1 5 2 版本当我使用以下代码迭代文件夹内的对象时 AmazonS3 s3 new AmazonS3Client new PropertiesCred
当responseText包含有效的Xml时，IXMLHttpRequest.responseXml为空，没有解析错误

我正在从中获取一些 XML政府网站 http www bankofcanada ca stats assets rates rss noon en all xml http www bankofcanada ca stats assets
Java 8 流 - 合并共享相同 ID 的对象集合

我有一系列发票 class Invoice int month BigDecimal amount 我想合并这些发票这样我每个月都会收到一张发票金额是本月发票金额的总和例如 invoice 1 month 1 amount 1000
很好地处理数据库约束错误

再一次它应该很简单我的任务是在我们的应用程序的域对象中放置一个具有唯一约束的特定字段这本身并不是一个很大的挑战我刚刚做了以下事情 public class Location more fields Column unique tru
编辑文件名在 JComboBox 中的显示方式，同时保持对文件的访问

我对 Java 很陌生对堆栈溢出也很陌生我正在尝试利用 JMF API 创建一个用 Java 编码的简单媒体播放器到目前为止我已经能够设置一个简单的队列播放列表来使用JComboBox called playListHolder
在 Delphi 中使用 XML（将特定数据返回到变量）

过去几天我一直在尝试使用 Delphi 2010 和 MSXML 我是一个极端的新手需要一点指导 var MemoryStream TMemoryStream XMLPath String sName String XMLDoc vari
Java整数双除法混淆[重复]

这个问题在这里已经有答案了方案1 int sum 30 double avg sum 4 result is 7 0 not 7 5 VS 方案2 int sum 30 double avg sum 4 0 Prints lns 7 5
欧洲中部时间 14 日 3 月 30 日星期五 00:00:00 至日/月/年

我尝试解析格式日期Fri Mar 30 00 00 00 CET 14至日月年这是我的代码 SimpleDateFormat formatter new SimpleDateFormat dd MM yyyy System out
如何知道抛出了哪个异常

我正在对我们的代码库进行审查有很多这样的陈述 try doSomething catch Exception e 但我想要一种方法来知道 doSomething 抛出了哪个异常在 doSomething 的实现中没有 throw 语句
Netty：阻止调用以获取连接的服务器通道？

呼吁ServerBootstrap bind 返回一个Channel但这不是在Connected状态因此不能用于写入客户端 Netty 文档中的所有示例都显示写入Channel从它的ChannelHandler的事件如channelCon
Cucumber Java 与 Spring Boot 集成 - Spring @Autowired 抛出 NullPointer 异常

我正在为 Spring boot 应用程序编写 cucumber java 单元测试来测试每个功能当我与 Spring Boot 集成时 Autowired 类抛出 NullPointer 异常 Spring Boot应用程序类 Spri
Java中的Object类是什么？

什么是或什么类型private Object obj Object http download oracle com javase 6 docs api java lang Object html是Java继承层次结构中每个类的最终祖先从
Eclipse 中 Spring MVC 模型对象的 (jsp /jstl) 视图中的代码辅助

在 Spring MVC 中当将对象放置在视图模型中时如下所示 public String getUser Model model fetch user model addAttribute user user return viewN
ServletContainer 类未找到异常

我无法再编译我的球衣项目并且出现以下异常 GRAVE Servlet Project API threw load exception java lang ClassNotFoundException com sun jersey spi
带有 Maven Wrapper 的 Java 17 导致无法识别的 VM 选项“MaxPermSize=512m”

I use OpenJDK 17 https jdk java net 17 使用 Maven Wrapper 3 8 2 从春季初始化 https start spring io Maven项目 JAR打包 Java 17 Spring

随机推荐

根据 pandas 列中的列表值从 DataFrame 中选择行

我是 pandas 的新手我有一个简单的数据框想要根据列提取某些行然而此列中的类型是列表 Example df pd DataFrame text1 1 2 3 text2 2 3 4 columns text list value
rake asset:precompile 和 RAILS_ENV=生产 rake asset:precompile 之间有什么区别？

这两个任务有什么区别为什么我需要在 cap 部署时添加 RAILS ENV production thanks 您需要指定RAILS ENV production环境变量以便您的config environments productio
N2965 - std::bases 和 std::direct_bases 的状态是什么？

我正在编写一个模板它确实需要了解其参数类型的所有基类这std bases提出的特质N2965非常适合此目的但是我找不到有关其状态的任何可靠信息这个提案还有效吗如果是这样我们什么时候可能会看到它标准化如果没有是否还有其他提案可
spect.currentframe() 在某些实现下可能不起作用？

根据docs inspect currentframe 返回调用者堆栈的框架对象框架 CPython实现细节该函数依赖于Python堆栈解释器中的框架支持不保证存在于 Python 的所有实现如果在没有的实现中运行 Python
未为内部服务器错误响应 ASP.NET Core 3.1 设置 CORS 标头

这是我的 CORS 配置 services AddCors options gt options AddPolicy name AllowedOrigins policyBuilder gt var urls Configuration G
选择大于某个值的列

我的问题看起来很简单但我查了很多答案但没有找到合适的答案所以我有一个小数据如下所示我希望 count 36 只查找包含大于 36 的列我的代码如下 count 36 lt df which df 1 19 gt 36 数据如下所
Tkinter 树视图选择

from Tkinter import from ttk import import tkMessageBox class Application Frame def selected self curItem self tree focu
修改 bash 脚本中的 $READLINE_LINE 和 $READLINE_POINT 值

接听时这个问题我用了一个非常凌乱的bind函数根据 my 的结果修改当前行automplete sh script 当我最终将此脚本用于个人用途时我尝试简化bind并尝试直接在脚本内进行所有读取和修改到目前为止我可以访问 READLI
WP7 - 列表框绑定

我有一个 ObservableCollection 我想将其绑定到我的列表框 lbRosterList ItemsSource App ViewModel rosterItemsCollection 但是在该集合中我还有另一个集合 Dat
[[：找不到命令

我正在没有 sudo 权限的系统上安装 RVM 理论上它应该工作得很好但是当我添加时 s HOME rvm scripts rvm source HOME rvm scripts rvm 到 bash profile 它没有做它应该做的事
检查项目后会触发哪个 CheckedListBox 事件？

我有一个 CheckedListBox 我想要一个事件after检查一个项目以便我可以将 CheckedItems 与新状态一起使用由于 ItemChecked 在 CheckedItems 更新之前被触发因此它无法开箱即用当 Ch
替换功能不替换[重复]

这个问题在这里已经有答案了我按照一些文档使用 JavaScript 替换函数但它没有改变任何内容不会抛出任何错误知道我做错了什么吗该变量是从 XML 中检索的也许需要将其转换为字符串或其他内容 for var i 0 iln p
通过 jQuery 在 YouTube 嵌入电影中启用自动播放

我使用以下代码嵌入 YouTube 电影正如您在 src 属性中看到的有一个变量 autoplay 0 我在 jQuery 中编写了两行脚本应将 autoplay 变量设置为 1 var title iframe ytplayer a
在VBA中处理大数

如何在VBA中处理10E22这样的非常大的数字 dim a b c as double a 1234567890123456789012 c a bit b a c 1 bit 我得到 b 0 按照建议我改变dim a as double
这是 JSON.NET 或实体框架中的错误，还是我在尝试使用 JSON.NET 序列化异常列表时做错了什么？

尝试序列化一组错误时出现此错误 ISerialized 类型 System Data Entity Infrastruct DbUpdateConcurrencyException 没有有效的构造函数要正确实现 ISerialized 应
调用 getBluetoothService() 时没有使用 BluetoothManagerCallback

我是安卓开发新手我正在编写一个应用程序它从笔记本电脑的蓝牙终端接收字符串打开连接时执行以下行时我收到错误连接被拒绝 socket connect 我尝试检查 connect 方法中发生了什么在这里我发现 Android Stu
替换为 preg_replace 中的动态变量

我陷入了这个问题即我有一个像这样的数组 array name gt John email gt email protected 和这样的字符串样本 string Hi name your email is email 问题很明显将名称
无法使用接口默认方法

我已经安装了新版本的 Visual Studio 并将项目设置为 C 8 当我尝试使用如下所示的新界面功能时它说我无法在界面中实现这似乎不知何故我无法使用新功能谁能解释一下为什么它仍然没有包含在 2019 年预览中吗 interfa
使用 htaccess 将所有内容重定向到 index.php

我正在编写一个简单的基于 PHP 的 MVC 框架我希望这个框架能够安装在任何目录中我的 PHP 脚本获取请求 uri 并将其分成多个段它使段 1 成为控制器使段 2 成为动作当我这样做时一切都很好 http www exampl
使用dom java解析xml

我有以下 xml

使用dom java解析xml

使用dom java解析xml 的相关文章

随机推荐

热门标签