使用 etree 从文件中解析 xml 在读取字符串时有效，但在读取文件时则无效

2023-12-14

我对 Python 和 SO 来说是一个相对新手。我有一个 xml 文件，需要从中提取信息。我已经为此苦苦挣扎了好几天，但我想我终于找到了可以正确提取信息的东西。现在我在获得正确的输出时遇到了麻烦。这是我的代码：

from xml import etree
node = etree.fromstring('<dataObject><identifier>5e1882d882ec530069d6d29e28944396</identifier><description>This is a paragraph about a shark.</description></dataObject>')
identifier = node.findtext('identifier')
description = node.findtext('description')
print identifier, description

我得到的结果是“5e1882d882ec530069d6d29e28944396这是一段关于鲨鱼的段落。”，这就是我想要的。

然而，我真正需要的是能够从文件而不是字符串中读取。所以我尝试这段代码：

from xml import etree
node = etree.parse('test3.xml')
identifier = node.findtext('identifier')
description = node.findtext('description')
print identifier, description

现在我的结果是“无无”。我有一种感觉，要么文件输入不正确，要么输出有问题。这是test3.xml的内容

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<response xmlns="http://www.eol.org/transfer/content/0.3" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dwc="http://rs.tdwg.org/dwc/dwcore/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#" xmlns:dwct="http://rs.tdwg.org/dwc/terms/" xsi:schemaLocation="http://www.eol.org/transfer/content/0.3 http://services.eol.org/schema/content_0_3.xsd">
  <identifier>5e1882d822ec530069d6d29e28944369</identifier>
  <description>This is a paragraph about a shark.</description>

您的 XML 文件使用默认命名空间。您需要使用正确的命名空间来限定您的搜索：

identifier = node.findtext('{http://www.eol.org/transfer/content/0.3}identifier')

让 ElementTree 匹配正确的元素。

您还可以给.find(), findall() and iterfind()方法是显式命名空间字典。这没有很好的记录：

namespaces = {'eol': 'http://www.eol.org/transfer/content/0.3'} # add more as needed

root.findall('eol:identifier', namespaces=namespaces)

前缀是only抬头望去namespaces您传入的参数。这意味着您可以使用任何您喜欢的命名空间前缀； API 分离了eol:部分，在中查找相应的命名空间 URLnamespaces字典，然后更改搜索以查找 XPath 表达式{http://www.eol.org/transfer/content/0.3}identifier反而。

如果您可以切换到lxml library事情变得更好了；该库支持相同的 ElementTree API，但会在.nsmap元素上的属性。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 etree 从文件中解析 xml 在读取字符串时有效，但在读取文件时则无效的相关文章

使用ASP/VB获取节点属性值

我有以下 XML 架构
如何收集列表、字典等中重复计算的结果（或制作修改每个元素的列表的副本）？

There are a great many existing Q A on Stack Overflow on this general theme but they are all either poor quality typical
Flask 和 uWSGI - 无法加载应用程序 0 (mountpoint='')（找不到可调用或导入错误）

当我尝试使用 uWSGI 启动 Flask 时出现以下错误我是这样开始的 gt cd gt root localhost uwsgi socket 127 0 0 1 6000 file path to folder run py ca
打破嵌套循环[重复]

这个问题在这里已经有答案了有没有比抛出异常更简单的方法来打破嵌套循环在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签并且至少继续一个外循环 for x in range 10 fo
Python tcl 未正确安装

我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
__del__ 真的是析构函数吗？

我主要用 C 做事情其中析构函数方法实际上是为了销毁所获取的资源最近我开始使用python 这真的很有趣而且很棒我开始了解到它有像java一样的GC 因此没有过分强调对象所有权构造和销毁据我所知 init 方法对我来说在 py
当responseText包含有效的Xml时，IXMLHttpRequest.responseXml为空，没有解析错误

我正在从中获取一些 XML政府网站 http www bankofcanada ca stats assets rates rss noon en all xml http www bankofcanada ca stats assets
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
扩展 XSD 文件

我有一个带有枚举类型的 XSD 文件我想创建一个扩展 XSD 文件它添加一些额外的枚举但其他方面的行为就像主 XSD 一样例如主 XSD 文件包含以下内容
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
Python 3 中“map”类型的对象没有 len()

我在使用 Python 3 时遇到问题我得到了 Python 2 7 代码目前我正在尝试更新它我收到错误类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
在 Python 类中动态定义实例字段

我是 Python 新手主要从事 Java 编程我目前正在思考Python中的类是如何实例化的我明白那个 init 就像Java中的构造函数然而有时 python 类没有 init 方法在这种情况下我假设有一个默认构造函数就像
Spark.read 在 Databricks 中给出 KrbException

我正在尝试从 databricks 笔记本连接到 SQL 数据库以下是我的代码 jdbcDF spark read format com microsoft sqlserver jdbc spark option url jdbc sql
Python - 字典和列表相交

给定以下数据结构找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出我可以将列表不是 dict1 组织到任何其他数
Python：元类属性有时会覆盖类属性？

下面代码的结果让我感到困惑 class MyClass type property def a self return 1 class MyObject object metaclass MyClass a 2 print MyObject
Pandas 与 Numpy 数据帧

看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组否则我们的代码将无法工作我知道 pandas Data

随机推荐

Azure Graph API、Angular、获取用户组

我想查询 Azure AD Graph API 以检索团体声称对于从注册的 Azure B2C 应用程序登录的用户我调用的应用程序是 Angular 5 SPA 在尝试了 Azure Active Directory 和 adal ang
C 中返回值周围的括号

在 ANSI C 代码中我经常可以看到单个返回值周围有括号像这样 int foo int x if x return 1 else return 0 在这些情况下为什么要在返回值周围使用有任何想法吗我看不出有什么理由没有什么真正的
Cloud Firestore 中多租户的命名空间

我们如何在 Firestore 中设置不同的数据库命名空间这将有助于构建多租户 SaaS 产品这是正在考虑的事情但还没有确定的计划当前的方法需要您创建单独的项目集合名称方案可能是可行的但您将遇到项目的复合索引限制
为什么Python对可以嵌套的静态块的数量有限制？

Python 中静态嵌套块的数量限制为 20 个即嵌套19for循环就可以了虽然非常耗时 O n 19 太疯狂了但嵌套 20 会失败并显示 SyntaxError too many statically nested blocks
MVC 2 接口上的 UpdateModel，是否应该忽略 ModelBinderAttribute？

我有从特定抽象类的实例发布数据的表单 public abstract class IRestriction public string Name get set public abstract IModelBinder GetBinder
如何将模型或字符串传递给 angularjs 中的指令？

我正在研究一个指令其中参数之一可以是模型动态值有时也可以是字符串我能做到这一点的唯一方法是使用有一个更好的方法吗
搜索 HTML 表 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心以获得指导我已经用 HTML 创建了
之前触发 onchange 时未触发 onclick 事件

我这里有一个有趣的问题我有一个文本区域其中链接了一个 onchange 事件然后我有一个链接到 onclick 事件的按钮当在文本区域上触发 onchange 事件时将处理放入文本区域的文本当我单击文本区域之外的内容时通常会发
使用 pyodbc 和 mysql8 的参数化查询对于 int 数据类型的列返回 0

蟒蛇 2 7 12 pyodbc 4 0 24 操作系统 Ubuntu 16 4 数据库 MySQL 8 驱动程序 MySQL 8 预期行为结果集应在数据类型为 int 的列中包含数字实际行为所有 int 数据类型的列都有 0 如果使
带有 ListBox 的 WPF ListBox - UI 虚拟化和滚动

我的原型显示包含页面的文档由缩略图表示每个文档可以有任意数量的页面例如可能有 1000 个文档每个文档 5 页或 5 个文档每个文档 1000 页每个或介于两者之间文档不包含其他文档在我的 xaml 标记中我有
当我的整个应用程序锁定在纵向模式时，以横向模式全屏播放视频

我想以全屏横向模式播放视频我的应用程序锁定在纵向模式如何实现这一点请帮我提前致谢 swift 3 中最简单的解决方案将其添加到您的应用程序委托中 func application application UIApplication
在 Firebase 中获取子项计数

请问我如何简单地从 firebase 查询中获取子项计数例如假设我使用包含 10 个子项的数据库查询我如何获取该值因为我尝试使用onChildChanged 事件并从中获取价值snapshot 但效果并不好这是因为首先它会获取数字
无法连接到服务器 - 与网络相关或特定于实例的错误

尝试连接到 SQL Server 时出现以下错误建立与 SQL Server 的连接时发生与网络相关或特定于实例的错误服务器未找到或无法访问验证实例名称是否正确以及 SQL Server 是否配置为允许远程连接提供程序命名管道提供
将派生类指针数组转换为基类指针数组

考虑这样的继承层次结构 A B1 B2 C D 在C 中实现如下 class A public A virtual A 0 double a A A class B1 virtual public A public B1 virtual B
如何计算 numpy 数组沿轴的平均值？ [复制]

这个问题在这里已经有答案了我是Python新手这是我的三维数组 my data numpy zeros index1 index2 index3 为了便于说明假设尺寸为 index1 5 index2 4 index3 100 我想计
使用 SNI 选项以编程方式在 IIS 8 上添加绑定

我正在尝试使用 Microsoft Web Administration 库 NET Framework 创建 IIS 8 的绑定该绑定已检查标志 SNI 服务器名称指示这对我来说是必要的因为我想在 IIS 下为同一个网站获取多个 S
Swing、Java 和多线程以及着色按钮

是的这是家庭作业是的我完全被困住了这是要点我创建了一个 JFrame 有 3 个面板顶部中间底部底部面板中有 3 个按钮红色绿色和蓝色顶部面板中有 3 个文本字段用于显示单击相应按钮的次数每个按钮最多允许 10
使用平衡组的正则表达式

我有一个基本的文本模板引擎它使用如下语法 foo bar IF MY VAR some text IF OTHER VAR some other text ENDIF ENDIF bar foo 我对用于解析它的正则表达式有一个问题它没
Javascript：比较运算符中操作数的顺序[重复]

这个问题在这里已经有答案了我看到很多人写作有什么具体原因吗 if 1 a 代替 if a 1 我已经给出了一个答案其中我写了类似的内容Array obj constructor当有人问我他经常看到人们这样写而不是这样写obj const
使用 etree 从文件中解析 xml 在读取字符串时有效，但在读取文件时则无效

我对 Python 和 SO 来说是一个相对新手我有一个 xml 文件需要从中提取信息我已经为此苦苦挣扎了好几天但我想我终于找到了可以正确提取信息的东西现在我在获得正确的输出时遇到了麻烦这是我的代码 from xml impor

使用 etree 从文件中解析 xml 在读取字符串时有效，但在读取文件时则无效

使用 etree 从文件中解析 xml 在读取字符串时有效，但在读取文件时则无效 的相关文章

随机推荐

热门标签

使用 etree 从文件中解析 xml 在读取字符串时有效，但在读取文件时则无效的相关文章