从 XML 构建树结构的速度很慢

2024-05-10

我正在将 XML 文档解析为我自己的结构，但对于大型输入来说构建它非常慢，是否有更好的方法来做到这一点？

public static DomTree<String> createTreeInstance(String path) 
  throws ParserConfigurationException, SAXException, IOException {
    DocumentBuilderFactory docBuilderFactory = DocumentBuilderFactory.newInstance();
    DocumentBuilder db = docBuilderFactory.newDocumentBuilder();
    File f = new File(path);
    Document doc = db.parse(f);       
    Node node = doc.getDocumentElement(); 
    DomTree<String> tree = new DomTree<String>(node);
    return tree;
}

这是我的 DomTree 构造函数：

    /**
     * Recursively builds a tree structure from a DOM object.
     * @param root
     */
    public DomTree(Node root){      
        node = root;        
        NodeList children = root.getChildNodes();
        DomTree<String> child = null;
        for(int i = 0; i < children.getLength(); i++){  
            child = new DomTree<String>(children.item(i));
            if (children.item(i).getNodeType() != Node.TEXT_NODE){
                super.children.add(child);
            }
        }
    }

UPDATE:

我使用 100MB XML 文件对 createTreeInstance() 方法进行了基准测试：

创建 docBuilderFactory...完成 [3ms]
创建 docBuilder...完成 [21ms]
正在解析文件...完成 [5646ms]
getDocumentElement...完成 [1ms]
创建 DomTree...完成 [17076ms]

UPDATE:

正如 John Doe 在下面建议的那样，使用 SAX 可能更合适 - 我以前从未使用过 SAX，那么有没有一个好的方法可以将我必须的内容转换为使用 SAX？

如果您要解析大型 XML，则不会使用 DOM，而是使用 SAX、拉式解析器（例如 XPP3 或其他任何解析器）。

问题是内存中不会有一个可能很方便的“XML 树”，您只能获取事件并相应地处理它们。然而，这将是内存明智的，并且您可以将元素映射到数据结构。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

xml

Optimization

Parsing

Tree

从 XML 构建树结构的速度很慢的相关文章

Java JDBC：更改表

我希望对此表进行以下修改添加状态列 varchar 20 日期列时间戳我不确定该怎么做 String createTable Create table aircraft aircraftNumber int airLineCompa
使用非 ASCII（自然语言）XML 标签是否合适？

使用以非 ASCII 自然语言编写的 XML 标签元素名称是否合适 XML 规范允许这样做请参阅Names http www w3 org TR 2006 REC xml11 20060816 NT Name and 例外情况 htt
在 HTTPResponse Android 中跟踪重定向

我需要遵循 HTTPost 给我的重定向当我发出 HTTP post 并尝试读取响应时我得到重定向页面 html 我怎样才能解决这个问题代码 public void parseDoc final HttpParams params n
制作一个交互式Windows服务

我希望我的 Java 应用程序成为交互式 Windows 服务用户登录时具有 GUI 的 Windows 服务我搜索了这个我发现这样做的方法是有两个程序第一个是服务第二个是 GUI 程序并使它们进行通信服务将从 GUI 程序获取
Android MediaExtractor seek() 对 MP3 音频文件的准确性

我在使用 Android 时无法在eek 上获得合理的准确度MediaExtractor 对于某些文件例如this one http www archive org download emma solo librivox emma 01
Spark 1.3.1 上的 Apache Phoenix（4.3.1 和 4.4.0-HBase-0.98）ClassNotFoundException

我正在尝试通过 Spark 连接到 Phoenix 并且在通过 JDBC 驱动程序打开连接时不断收到以下异常为简洁起见下面是完整的堆栈跟踪 Caused by java lang ClassNotFoundException org a
列出jshell中所有活动的方法

是否有任何命令可以打印当前 jshell 会话中所有新创建的方法类似的东西 list但仅适用于方法您正在寻找命令 methods all 它会打印所有方法包括启动 JShell 时添加的方法以及失败被覆盖或删除的方法对于您声明的
反射找不到对象子类型

我试图通过使用反射来获取包中的所有类当我使用具体类的代码本例中为 A 时它可以工作并打印子类信息 B 扩展 A 因此它打印 B 信息但是当我将它与对象类一起使用时它不起作用我该如何修复它这段代码的工作原理 Reflection
十进制到八进制的转换[重复]

这个问题在这里已经有答案了可能的重复十进制转换错误 https stackoverflow com questions 13142977 decimal conversion error 我正在为一个类编写一个程序并且在计算如何将八进
如何将 pfx 文件转换为 jks，然后通过使用 wsdl 生成的类来使用它来签署传出的肥皂请求

我正在寻找一个代码示例该示例演示如何使用 PFX 证书通过 SSL 访问安全 Web 服务我有证书及其密码我首先使用下面提到的命令创建一个 KeyStore 实例 keytool importkeystore destkeystore
getResourceAsStream() 可以找到 jar 文件之外的文件吗？

我正在开发一个应用程序该应用程序使用一个加载配置文件的库 InputStream in getClass getResourceAsStream resource 然后我的应用程序打包在一个 jar文件如果resource是在里面 ja
Eclipse Java 远程调试器通过 VPN 速度极慢

我有时被迫离开办公室工作这意味着我需要通过 VPN 进入我的实验室我注意到在这种情况下使用 Eclipse 进行远程调试速度非常慢速度慢到调试器需要 5 7 分钟才能连接到远程 jvm 连接后每次单步执行断点行可能需要 20 30
无法捆绑适用于 Mac 的 Java 应用程序 1.8

我正在尝试将我的 Java 应用程序导出到 Mac 该应用程序基于编译器合规级别 1 7 我尝试了不同的方法来捆绑应用程序 1 日食我可以用来在 Eclipse 上导出的最新 JVM 版本是 1 6 2 马文看来Maven上也存在同样的
如何从终端运行处理应用程序

我目前正在使用加工 http processing org对于一个小项目但是我不喜欢它附带的文本编辑器我使用 vim 编写所有代码我找到了 pde 文件的位置并且我一直在从 vim 中编辑它们然后重新打开它们并运行它们重新加载脚
Java列表的线程安全

我有一个列表它将在线程安全上下文或非线程安全上下文中使用究竟会是哪一个无法提前确定在这种特殊情况下每当列表进入非线程安全上下文时我都会使用它来包装它 Collections synchronizedList 但如果不进入非线程安
在activity_main.xml中注释

我是安卓新手据我所知 XML 中的注释与 HTML 中的注释相同使用形式我想在 Android 项目的 Activity main xml 配置文件中写一些注释但它给了我错误值得注意的是我使用的是 Eclipse 但目前我直
获取 JVM 上所有引导类的列表？

有一种方法叫做findBootstrapClass对于一个类加载器如果它是引导的则返回一个类有没有办法找到类已经加载了您可以尝试首先通过例如获取引导类加载器呼叫 ClassLoader bootstrapLoader ClassLo
使用 JMF 创建 RTP 流时出现问题

我正处于一个项目的早期阶段需要使用 RTP 广播DataStream创建自MediaLocation 我正在遵循一些示例代码该代码目前在rptManager initalize localAddress 出现错误无法打开本地数据端口
JGit 检查分支是否已签出

我正在使用 JGit 开发一个项目我设法删除了一个分支但我还想检查该分支是否已签出我发现了一个变量CheckoutCommand但它是私有的 private boolean isCheckoutIndex return startCo
java.lang.IllegalStateException：驱动程序可执行文件的路径必须由 webdriver.chrome.driver 系统属性设置 - Similiar 不回答

尝试学习 Selenium 我打开了类似的问题但似乎没有任何帮助我的代码 package seleniumPractice import org openqa selenium WebDriver import org openqa s

随机推荐

如何下载内存流文件

我是 asp net 的初学者我使用以下命令创建 pdf 文件PdfRpt http pdfreport codeplex com SourceControl BrowseLatest 我在课堂上写这段代码 namespace PdfRe
自动将变量名称添加到列表的元素[重复]

这个问题在这里已经有答案了我有一个模型列表为了使代码更易于维护因此可以方便地添加和删除模型我希望有一个地方来存储它们及其名称为此我必须解决以下命名问题上游我生成模型的方式比以下方式效率低如果是这样压缩的我会assign他
从安全角度来看，在 Windows 中使用管道是否被认为是危险的？

从安全角度来看在 Windows 中使用管道是否被认为是危险的管道在 Windows 中并不是一个特殊的安全风险如果您担心安全性请确保将管道上的安全描述符设置为适当的 DACL 如果您的使用要求管道开放供任何人连接那么您必须将传入
Flutter：删除按钮中的填充 - FlatButton、ElevatedButton、OutlinedButton

我希望删除 FlatButton 的默认边距但似乎无法设置覆盖它 Column children
jQuery 仅定位父 div 中的元素

我的页面上有许多小部件我想在整个页面中重复使用类我有一个问号图标应该在小部件内的 2 个 div 之间切换可见性问题是我无法让我的代码仅针对当前小部件我已经尝试过常用的技术但似乎没有一个在这里起作用小提琴在这里 http js
ASP.NET MVC - 授权属性登录重定向后保留 POST 数据

我有一个带有评论的博客文章页面任何用户无论是否登录都可以在页面底部看到一个表单来发表评论当用户输入评论且未获得授权时用户将被重定向到登录注册页面登录后用户将被重定向回操作但包含评论正文的 POST 数据会丢失我使用 AS
iPhone中的异步for循环

for循环看起来像这样我在视图中编写的确实加载了因此加载此页面需要更多时间 for int i 3 i lt dataDict objectForKey rss objectForKey channel objectForKey ite
Devise/CanCanCan - 允许管理员创建新用户

我正在使用 Rails 4 0 2 设计并康康康 https github com CanCanCommunity cancancan 我正在尝试允许管理员创建新用户管理员用户在用户表中分配有一个布尔字段在ability rb中我有以下
PHP - SQLite 与 SQLite3

我已经使用 SQLite 2 8 17 制作了一个 Web 应用程序我现在才发现有一个 SQLite3 在制作 Web 应用程序时它以某种方式逃避了我的注意可能是由于缺少 php 函数的文档我想知道使用 SQLite3 比 SQL
Scrapy：在调用之间保存cookie

有没有办法在 scrapy 爬虫的调用之间保留 cookie 目的网站需要登录然后通过 cookie 维持会话我宁愿重复使用会话也不愿每次都重新登录请参阅有关 cookie 的文档常见问题解答入口 http doc scrapy
Node.js 解析路由的最小函数

我有一个 Node js Express 应用程序正在运行它接收如下路由 app get resource res someFunction app get foo bar id someOtherFunction 这很棒并且工作正常我
Swift 为 .toInt 提供Optional(3) 而不是 3

尝试从字段中提取数字并继续获取可选数字而不是数字 IBOutlet weak var years UITextField IBAction func calculateYear sender AnyObject var a years
在 Android 上缩小时，Skobbler 注释会从地图中消失

目前我正在向地图视图添加注释列表代码类似于以下内容 Add to map view SKAnnotation annotation new SKAnnotation i annotation getLocation setLongitu
Azure ARM 模板、站点的 VNET 集成

我正在 Azure 云中管理整个系统的创建是否可以在模板内设置站点资源 Web 应用程序或功能的 VNET 集成附上我要管理的设置的屏幕截图是否可以在模板内设置站点资源 Web 应用程序或功能的 VNET 集成以下模板可用于创建
“@inject”-ed 属性保持为空

我试图将服务注入到我的 bean 中但它总是null 我收到以下错误 WELD 001000 根据基本 null 解析属性 userBean 时出错一些代码片段索引 xhtml
css伪类最后一个子问题

我在使用时遇到问题 last child伪选择器我有以下标记 div class apply container div
状态存储在 Fluxor 中的哪里？

我是与状态管理人员合作的新手目前我正在开发 blazor 应用程序我偶然发现了 fluxor 框架它允许通过 Flux 模式进行状态管理 Fluxor 对我来说工作得很好但是我似乎无法弄清楚页面状态的实际存储位置它是在缓存数据
防止浏览器弹出警告窗口

我正在尝试在新窗口中打开 jsp 页面使用 JavaScriptwindow open产生浏览器警告并且在某些情况下 firefox 将默认阻止弹出窗口有没有办法解决这个问题这不是恶意应用程序它是内部用户工具大多数浏览器不会阻止
在浏览器中覆盖 TAB

如果我在输入字段中输入文本并按ENTER我所知道的所有浏览器的默认行为是提交表单但是如果我按ENTER在文本区域内添加新行每当我按下时有什么方法可以模仿这种行为缩进而不是提交表单 TAB在文本区域内 Bespin https be
从 XML 构建树结构的速度很慢

我正在将 XML 文档解析为我自己的结构但对于大型输入来说构建它非常慢是否有更好的方法来做到这一点 public static DomTree

从 XML 构建树结构的速度很慢

从 XML 构建树结构的速度很慢 的相关文章

随机推荐

热门标签

从 XML 构建树结构的速度很慢的相关文章