如何从 XML 数据中获取特定元素？

2023-12-24

我有一些代码来检索 XML 数据：

import cStringIO
import pycurl
from xml.etree import ElementTree

_API_KEY = 'my api key'
_ima = '/the/path/to/a/image'

sock = cStringIO.StringIO()

upl = pycurl.Curl()

values = [
            ("key", _API_KEY),
            ("image", (upl.FORM_FILE, _ima))]

upl.setopt(upl.URL, "http://api.imgur.com/2/upload.xml")
upl.setopt(upl.HTTPPOST, values)
upl.setopt(upl.WRITEFUNCTION, sock.write)
upl.perform()
upl.close()
xmldata = sock.getvalue()
#print xmldata
sock.close()

结果数据如下所示：

<?xml version="1.0" encoding="utf-8"?>
<upload><image><name></name><title></title><caption></caption><hash>dxPGi</hash><deletehash>kj2XOt4DC13juUW</deletehash><datetime>2011-06-10 02:59:26</datetime><type>image/png</type><animated>false</animated><width>1024</width><height>768</height><size>172863</size><views>0</views><bandwidth>0</bandwidth></image><links><original>https://i.stack.imgur.com/dxPGi.png</original><imgur_page>http://imgur.com/dxPGi</imgur_page><delete_page>http://imgur.com/delete/kj2XOt4DC13juUW</delete_page><small_square>https://i.stack.imgur.com/dxPGis.jpg</small_square><large_thumbnail>https://i.stack.imgur.com/dxPGil.jpg</large_thumbnail></links></upload>

现在，跟随这个答案 https://stackoverflow.com/questions/1140672/parsing-xml/1140753#1140753，我试图从数据中获取一些特定值。

这是我的尝试：

tree = ElementTree.fromstring(xmldata)
url = tree.findtext('original')
webpage = tree.findtext('imgur_page')
delpage = tree.findtext('delete_page')

print 'Url: ' + str(url)
print 'Pagina: ' + str(webpage)
print 'Link de borrado: ' + str(delpage)

我得到一个AttributeError如果我尝试添加.text access:

Traceback (most recent call last):
  File "<pyshell#28>", line 27, in <module>
    url = tree.find('original').text
AttributeError: 'NoneType' object has no attribute 'text'

我在Python的帮助中找不到任何内容ElementTree关于这个属性。如何只获取文本而不获取对象？

我找到了一些有关获取文本字符串的信息here http://docs.python.org/library/xml.etree.elementtree.html#xml.etree.ElementTree.Element.findtext;但是当我尝试它时，我得到一个类型错误：

Traceback (most recent call last): 
  File "<pyshell#32>", line 34, in <module>
    print 'Url: ' + url
TypeError: cannot concatenate 'str' and 'NoneType' objects

如果我尝试打印'Url: ' + str(url)相反，没有错误，但结果显示为None.

如何获取网址、网页and从该 XML 中删除_page`数据？

Your find()调用正在尝试查找树顶部的直接子级，其标签名为original，而不是比该级别更低的标签。使用：

url = tree.find('.//original').text

如果您想查找树中带有名为的标签的所有元素original。 ElementTree 的模式匹配规则find()方法在此页面的表格中列出：http://effbot.org/zone/element-xpath.htm http://effbot.org/zone/element-xpath.htm

For //匹配它说：

选择当前元素下所有级别上的所有子元素（搜索整个子树）。例如，“.//egg”选择整个树中的所有“egg”元素。

编辑：这里有一些测试代码，它使用您发布的 XML 示例字符串，我刚刚在 TextMate 中通过 XML Tidy 运行它以使其清晰：

from xml.etree import ElementTree
xmldata = '''<?xml version="1.0" encoding="utf-8"?>
<upload>
    <image>
        <name/>
        <title/>
        <caption/>
        <hash>dxPGi</hash>
        <deletehash>kj2XOt4DC13juUW</deletehash>
        <datetime>2011-06-10 02:59:26</datetime>
        <type>image/png</type>
        <animated>false</animated>
        <width>1024</width>
        <height>768</height>
        <size>172863</size>
        <views>0</views>
        <bandwidth>0</bandwidth>
</image>
<links>
    <original>https://i.stack.imgur.com/dxPGi.png</original>
    <imgur_page>http://imgur.com/dxPGi</imgur_page>
    <delete_page>http://imgur.com/delete/kj2XOt4DC13juUW</delete_page>
    <small_square>https://i.stack.imgur.com/dxPGis.jpg</small_square>
    <large_thumbnail>https://i.stack.imgur.com/dxPGil.jpg</large_thumbnail>
</links>
</upload>'''
tree = ElementTree.fromstring(xmldata)
print tree.find('.//original').text

在我的机器上（运行 python 2.6.1 的 OS X）会生成：

Ian-Cs-MacBook-Pro:tmp ian$ python test.py 
https://i.stack.imgur.com/dxPGi.png

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

xml

xmlparsing

如何从 XML 数据中获取特定元素？的相关文章

KFold 和 ShuffleSplit CV 有什么区别？

看起来 KFold 每次迭代对象时都会生成相同的值而 Shuffle Split 每次都会生成不同的索引它是否正确如果是这样其中一个相对于另一个有什么用处 cv cross validation KFold 10 n folds 2
来自外部 XML 的 Android 本地化

是否可以使用从服务接收到的 XML 在运行时翻译 Android 应用程序如果可能的话请有人指出我正确的方向谢谢 Warning 我读到的所有内容都表明让您的应用程序更改语言不是一个好主意因为 Android 框架不支持它并且可
如何访问 log4net 附加程序文件值并在 azure 管道中替换

我正在尝试替换管道中的日志文件路径
Pyspark 数据框逐行空列列表

我有一个 Spark 数据框我想创建一个新列其中包含每行中具有 null 的列名称例如原始数据框是 col 1 col 2 col 3 62 45 null 62 49 56 45 null null null null null
使用 Scipy imsave 将 Numpy 数组保存到图像时保留未更改的数据

使用 Scipy 保存二维 Numpy 数组单个值时toimage or imsave像素值与 Numpy 数组中的像素值不完全匹配相反在某些区域主要是边缘图像算法似乎使用某种插值是否有一个选项可以停止插值并保留准确的数据例
在Python中创建一个新表

我正在尝试从数控机床中提取数据事件每毫秒发生一次我需要过滤掉一些用管道分隔的变量分隔符 PuTTy exe 程序生成的日志文件我尝试阅读熊猫但列不在同一位置 df pd read table data log sep 日志文件的一
在 Flask (WSGI) 中使用全局单例，我是否需要担心竞争条件？ [复制]

这个问题在这里已经有答案了 Flask 的 hello world 演示是 from flask import Flask app Flask name app route def hello return Hello World if n
如何使用 Pandas 将巨大的 CSV 转换为 SQLite？

我有一个巨大的表大约 60 GB 采用存档的 CSV 文件形式我想将其转换为 SQLite 文件我现在所做的事情如下 import pandas import sqlite3 cnx sqlite3 connect db sqlite
如何使用 Python 多处理避免在分叉进程中加载父模块

当您创建一个Pool使用Python的进程multiprocessing 这些进程将分叉父进程中的全局变量将显示在子进程中如下面的问题所述如何限制多处理进程的范围 https stackoverflow com questions 2
一行Python和SQLite代码，为什么需要加“，”？ [复制]

这个问题在这里已经有答案了 c execute INSERT INTO numbers VALUES random randint 0 100 如果我将上面的代码更改为 c execute INSERT INTO numbers VALUE
如何使用 PySpark 有效地将这么多 csv 文件（大约 130,000 个）合并到一个大型数据集中？

我之前发布了这个问题并得到了一些使用 PySpark 的建议如何有效地将这一大数据集合并到一个大数据框中 https stackoverflow com questions 60259271 how can i merge this la
Python正则表达式从字符串中获取浮点数

我正在使用正则表达式来解析字符串中的浮点数 re findall a zA Z d d t 是我使用的代码这段代码有问题如果数字和任何字符之间没有空格则不会解析该数字例如 0 1 2 3 4 5 6 7 8 9 的预期输出为 0 1
从 IMDbPy 结果中的片目中获取电影 ID

我正在尝试创建一个数据集允许我根据 Python IMDb API 中的演员 ID 和电影 ID 加入演员和电影现在我正在尝试从演员的电影作品中提取电影 ID 列表但无法做到例如我知道 Rodney Dangerfield 在
如何在C++中列出Python模块的所有函数名称？

我有一个 C 程序我想导入一个 Python 模块并列出该模块中的所有函数名称我该怎么做我使用以下代码从模块中获取字典 PyDictObject pDict PyDictObject PyModule GetDict pModule
大型数据集上的 Sklearn-GMM

我有一个很大的数据集我无法将整个数据放入内存中我想在这个数据集上拟合 GMM 我可以用吗GMM fit sklearn mixture GMM 重复小批量数据没有理由重复贴合只需随机采样您认为机器可以在合理时间内计算的尽可能多的数据
如何设置 matplotlib 表中列的背景颜色

我在一个目录中有多个 txt 文件例如 d memdump 0 txt 1 txt 10 txt 示例文本文件如下 Applications Memory Usage kB Uptime 7857410 Realtime 7857410
如何正确消除字典中的元素直到只剩下一个字符串

我真的需要这方面的帮助 def get winner dict winner new dict for winner in dict winner first letter winner 0 value dict winner winner
在游戏中实现功能

我在完成这部分作业时遇到了麻烦我必须宣布游戏的获胜者然后输入到函数中输入所有 if 语句后我必须创建一个函数def playGame 这必须包括 showRules user getUserChoice computer getCo
在Python 3.2中，我可以使用http.client打开并读取HTTPS网页，但urllib.request无法打开同一页面

我想打开并阅读https yande re https yande re with urllib request 但我收到 SSL 错误我可以使用以下方式打开并阅读页面http client用这个代码 import http client
为什么用字符串和时间增量转置 DataFrame 会转换数据类型？

这种行为对我来说似乎很奇怪 id列字符串在转置后转换为时间戳df如果另一列是时间增量 import pandas as pd df pd DataFrame id 00115 01222 32333 val 12 14 170 df v

随机推荐

为当前目录提供服务的简单文件服务器[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个非常简单的垃圾箱我可以在 shell 中启动它并让它为当前目录提供服务最好不是也许还有一个 p用于指定端口由于它应该
AWK -- 如何进行选择性多列排序？

在 awk 中我该怎么做 Input 1 a f 1 12 v 2 b g 2 10 w 3 c h 3 19 x 4 d i 4 15 y 5 e j 5 11 z 所需的输出通过对数值进行排序 5 1 a f 2 10 w 2 b
如何从 Snomed Postgres Sql 数据库查找关系

问题陈述从 Snomed CT 数据库中提取所有父母祖父母子女和孙子女描述我正在尝试在本地机器上设置 snomed 数据库来提取特定概念的关系所有父母和孩子使用 Concept id 我已经从以下位置下载了 snomed 数据
扁平化复杂的 json 对象以进行 mvc 绑定

我的控制器以 json 格式将对象图返回到视图如下所示 return Json customer 在视图上我的 json 对象看起来像这样 Name Joe Budget Amount 500 Spend 100 它正确映射到我的客户对象
MVC kendo 窗口 - 从 JavaScript 函数获取数据

我的应用程序中有这个剑道窗口 Html Kendo Window Name copyStructure Title Copy Structure Content Loading LoadContentFrom CopyStructure N
如何对解决方案中的所有文件禁用#nullable

我想将我的代码库迁移到可为空的引用之一迁移策略 https learn microsoft com en us dotnet csharp nullable migration strategies包括添加 nullable disabl
为什么Rails 的composite_primary_keys gem 不起作用？

我已按照说明进行操作here http roninonrails blogspot com 2008 04 gotcha compositeprimarykeys gem html 通过安装composite primary keys ge
比较 Hibernate 中日期时间字段的时间部分

我有一个使用 hibernate annotations mysql 组合进行 ORM 的应用程序在该应用程序中我得到了一个带有日期字段的实体我正在寻找一种在时间范围内选择该日期的方法所以hh mm ss没有日期部分 MySQL中有
Symfony：服务...依赖于不存在的参数 kernel.secret

我正在尝试设置一个新的 Symfony 项目当我执行 php console php config dump reference 时出现错误提示服务 uri signer 依赖于不存在的参数 kernel secret 您的意思是
解析SQL查询并提取列名和表名

我有一个这样的查询脚本 SELECT View1 OrderDate View1 Email SUM View1 TotalPayments FROM dbo View1 WHERE View1 OrderStatus Completed
如何在Mono中嵌入flash？

是否可以在单声道应用程序中嵌入闪存最好类似于它可以作为 ActiveX 控件嵌入到 Net 中的方式但是任何 Flash 命令可以以某种方式冒泡到 Mono 应用程序的方式都可以我原以为可以使用网页浏览器查看flash 但是我无法确定
显示下拉列表时微调器的状态是什么？

我正在创建一个带有自定义视图的微调器无论如何我设法在微调器处于非活动状态以及按下时显示不同的可绘制对象我希望在下拉列表显示时保持按下状态可绘制这是 mi XML 文件
虚拟析构函数和未定义的行为

这个问题不同于我何时为何应该使用virtual析构函数 struct B virtual void foo B lt not virtual struct D B virtual void foo D B p new D delete
绝对元素和

我试图在 Hackerrank 上解决这个问题 https www hackerrank com challenges playing with numbers problem https www hackerrank com challe
有什么办法可以持续运行服务吗？

Stack Overflow 上很少有类似的问题但没有一个解决方案适合我问题在于只有少数设备例如 OnePlus 和 MI 一旦用户从最近的应用程序中删除应用程序该服务就会被终止我读到这些 OEM 使用一些激进的策略来终止服务我
将 WordPress 网站移至新域后，jQuery 无法正常工作

我刚刚将我的网站移至 hostgator 上的新域但现在该网站的内容未显示无法运行的网站是http alcaldarone com http alcaldarone com我开发和工作的网站是http atcjr alcaldarone
Laravel 中的 whereHas 查询

大家好 filterArray explode filters data articles DB table products gt join product category function q q gt on product cate
CSS 列数和 Chrome 错误：如何避免溢出内容被裁剪

When column count被使用它似乎裁剪任何overflow内容 columns webkit column count 1 webkit column gap 10px webkit column fill auto moz
在 C++ 中表示浮点无穷大的方法

我想在我的程序中用 C 表达浮点无穷大我遇到了两种方法来实现这一目标使用INFINITY and std numeric limits
如何从 XML 数据中获取特定元素？

我有一些代码来检索 XML 数据 import cStringIO import pycurl from xml etree import ElementTree API KEY my api key ima the path to a i

如何从 XML 数据中获取特定元素？

如何从 XML 数据中获取特定元素？ 的相关文章

随机推荐

热门标签

如何从 XML 数据中获取特定元素？的相关文章