使用正则表达式在 Python 中解析 XML

2024-03-23

我正在尝试使用正则表达式来解析XML文件（就我而言，这似乎是最简单的方法）。

例如，一行可能是：

line='<City_State>PLAINSBORO, NJ 08536-1906</City_State>'

要访问标签 City_State 的文本，我使用：

attr = re.match('>.*<', line)

但没有返回任何内容。

有人可以指出我做错了什么吗？

你通常不想使用re.match. 引用自文档 http://docs.python.org/2/library/re.html#re.match:

如果您想在字符串中的任何位置找到匹配项，请使用search() http://docs.python.org/2/library/re.html#re.search相反（另见search() 与 match() http://docs.python.org/2/library/re.html#search-vs-match).

Note:

>>> print re.match('>.*<', line)
None
>>> print re.search('>.*<', line)
<_sre.SRE_Match object at 0x10f666238>
>>> print re.search('>.*<', line).group(0)
>PLAINSBORO, NJ 08536-1906<

另外，当你可以使用类似的东西时，为什么还要用正则表达式解析 XMLBeautifulSoup http://www.crummy.com/software/BeautifulSoup/ :).

>>> from bs4 import BeautifulSoup as BS
>>> line='<City_State>PLAINSBORO, NJ 08536-1906</City_State>'
>>> soup = BS(line)
>>> print soup.find('city_state').text
PLAINSBORO, NJ 08536-1906

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

xml

regex

使用正则表达式在 Python 中解析 XML 的相关文章

在 HSV 颜色空间内定义组织学图像掩模的颜色范围（Python、OpenCV、图像分析）：

为了根据颜色将组织学切片分成多个层我修改了 OpenCV 社区提供的一些广泛分布的代码 1 我们的染色程序用不同的颜色标记组织横截面的不同细胞类型 B 细胞为红色巨噬细胞为棕色背景细胞核为蓝色 I m interested in se
OpenPyXL - 如何查询单元格边框？

python 和 openpyxl 都是新的编写一个 py 脚本来遍历大量 Excel 工作簿工作表并且需要找到由边框格式标识的某些单元格我在网上看到几个关于如何设置单元格边框的示例但我需要阅读它们具体来说当表内的数据不一致但
如何分组显示argparse子命令？

对于具有许多子命令的程序我想在 help 输出中显示它们按逻辑分组 Python argparse 有一个add argument group http docs python org library argparse html argp
EOutOfMemory 使用 Delphi 创建大型 XML

我正在使用 Delphi 从关系数据库中的数据创建 XML 文档它在小数据集上测试得很好但是当我尝试将数据集的大小扩展到生产级别时它最终在节点创建期间因 EOutOfMemory 异常而崩溃我正在使用放在表单上的 TXMLDocum
time.sleep - TypeError：需要一个浮点[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案 time sleep 2 TypeError a float is required 我该如何解决我不确定我应该在这里做什么您
Visual Studio Code 调试控制台中的 pydevd 警告

我已经搜索了一段时间但找不到任何相关问题当使用 Visual Studio Code 和 Python 扩展来调试大型元素时计算表示或获取属性可能需要一些时间在这些情况下会出现如下警告 pydevd 警告计算 DataFrame
Java 正则表达式中 \w 和 \b 的 Unicode 等效项？

许多现代正则表达式实现解释 w字符类简写为任何字母数字或连接标点符号通常下划线这样正则表达式就像 w 匹配像这样的词hello l ve GO 432 or gefr ig 不幸的是 Java 没有在爪哇 w仅限于 A Za
如何获取一个类的所有实例

我是一名初学者正在学习 Python 我想创建一个课程Person 在构造函数中我想将我创建的每个实例放入一个名为实例的集合中然后我希望实例方法返回所有实例我怎样才能做到这一点 class Person Type annota
如何在 django admin 中使用自定义字段进行搜索

我有一个模型并已注册到管理员并且我已使用自定义字段在列表中显示 class ReportsAdmin admin ModelAdmin def investment self inst return models OrderDetail
使用 ruamel.yaml，如何使带有 NEWLINE 的变量成为不带引号的多行

我正在生成用作协议的 YAML 其中包含一些生成的 JSON import json from ruamel import yaml jsonsample id 123 type customer account other myyamel
使用 Python 将 Json 转换为换行 Json 标准

我有一个获取嵌套对象并删除所有嵌套的代码使对象平坦 def flatten json y param y Unflated Json return Flated Json out def flatten x name if type x
如何检查php字符串是否只包含英文字母和数字？

在 JS 中我使用了这段代码 if string match A Za z0 9 但我不知道如何在 PHP 中做到这一点 Use 预匹配 http php net manual en function preg match php if p
如何在Python中的字符串中插入变量值

这是一个简单的例子 amount1 input Insert your value amount2 input Insert your value print Your first value is amount1 your second
从流中过滤/删除无效的 xml 字符

首先我无法更改 xml 的输出它是由第三方生成的他们在 xml 中插入无效字符我得到了 xml 字节流表示形式的 InputStream 除了将流消耗到字符串中并对其进行处理之外是否有一种更干净的方法来过滤掉有问题的字符我找到了
当输入是 DataFrame 时，在seaborn中对箱线图进行分组

我打算在一个图中绘制多个列pandas dataframe 全部按另一列分组使用groupby inside seaborn boxplot 对于类似的问题这里有一个很好的答案matplotlib matplotlib 分组箱线图 ht
在 Django 中删除特定用户的所有会话的最优化方法？

我正在运行 Django 1 3 使用会话中间件和身份验证中间件 settings py SESSION ENGINE django contrib sessions backends db Persist sessions to DB S
通过 Selenium 和 python 切换到 iframe

我如何在硒中切换到这个 iframe 只知道您可以使用 XPath 来定位 iframe driver find element by xpath iframe name Dialogue Window Then switch to th
忽略稀疏矩阵中的重复条目

我尝试过初始化csc matrix and csr matrix从列表中 data rows cols 值如文档所示 sparse csc matrix data rows cols shape n n 问题是我实际上拥有的生成方法dat
Pandas 数据透视表同时包含多列

我怀疑是否pandas pivot table可以一次接受两列并单独处理它们而不是分层处理假设我有以下数据框 id date day val 101 11 1 1 1 2 1 101 11 1 2 2 2 2 101 11 1 3 3
python nltk从句子中提取关键字

我们要做的第一件事就是杀掉所有律师威廉莎士比亚鉴于上面的引用我想退出 kill and lawyers 作为两个突出的关键词来描述句子的整体含义我提取了以下名词动词 POS 标签 First NNP thing NN do V

随机推荐

术语“元组”在关系数据库中意味着什么？

请解释一下sql中的元组是什么意思谢谢这里的大多数答案都在正确的轨道上然而一个row 不是元组 Tuples are 无序的带名称的已知值集因此以下元组是相同的东西我使用虚构的元组语法因为关系元组很大程度上是一个理论构造 x
UWP：模拟 Windows IoT 上特定坐标的点击

有没有办法模拟 Windows IoT 上特定坐标的点击我尝试使用 mouse event mouse event MOUSEEVENTF LEFTDOWN x y 0 0 但是我收到此错误 System EntryPointNotFo
JavaScript 中的动态对象构造？

当我想使用从其他地方提供的参数调用 javascript 中的函数时我可以使用apply函数的方法如下 array arg1 5 arg3 someFunc apply null array 但是如果我需要以类似的方式调用构造函数怎么办
将值从工厂传递到控制器 angularJS

这可能看起来像一个愚蠢的问题但几乎花了整整3个小时但仍然无法弄清楚我在这里做错了什么可能有人可以指出原因以及如何解决这个问题我觉得这是一个简单的解决方案但仍然看不到它所以事情是这样的我有this http nhnent git
VIM - 从项目中的多个位置采购标签

再会我通常从事相对较小少于 20 000 行代码的项目这些项目全部包含在单个目录中有自己的 Makefile 并且相当容易使用 VIM is my preferred editor and when I open a projec
有没有办法在 Google Play 上提交reactjs PWA？

我想使用一次编写到处运行所以我用create react app在reactjs中创建了一个PWA 我的应用程序运行良好我可以将其从网站放在手机的主屏幕上不过我也希望在移动商店中可见从 Google Play 开始 I tri
Boto3 Python Lambda 自定义返回错误

有没有办法以 HTTP 响应的形式自定义 Boto3 Lambda 异常消息并返回它同时发送强制失败这是一个例子 except Exception as e print nException failed to invoke jobs
Cloudsight Api 对 Android 平台上的图像上传提供空响应

我正在尝试上传图像 https api cloudsightapi com image requests https api cloudsightapi com image requests 但在请求调用之后我将所有字段都设为 null
禁用手势下拉表单/页面表模式呈现

在 iOS 13 中使用表单和页面样式的模式演示可以通过向下平移手势来关闭这在我的一张表单中是有问题的因为用户绘制到这个框中会干扰手势它将屏幕向下拉而不是绘制垂直线如何在以工作表形式呈现的模式视图控制器中禁用垂直滑动以消除手势
为什么我看不到 mod_wsgi 的进程

我有一个 wsgi 应用程序配置如下 WSGIApplicationGroup GLOBAL WSGIDaemonProcess myapp user myuser threads 10 maximum requests 10000 WSG
window.unload() 在 jQuery 中不起作用

我试图在关闭页面后提醒一些事情一个简单的window unload示例如下 HTML
针对整个表验证 UPDATE 和 INSERT 语句

我正在寻找向表添加约束的最佳方法该约束实际上是表上的唯一索引关系该记录与该表中的其余记录之间想象一下下表描述了各个警卫的巡逻情况来自之前的看守场景 PK PatrolID Integer FK GuardID Integer Star
如何分析单个 Java (Spring) 方法的运行？

我有一个在我的 PC 上运行的 Java Spring 应用程序我可以附加调试器我正在寻找一种分析单个方法的方法最好是具有 UI 来深入了解消耗最多时间的子方法的方法我尝试了 JDK 任务控制和 IntelliJ 的默认分析器我相
jQuery.fn 是什么意思？

什么是fn这里的意思是 jQuery fn jquery 在 jQuery 中 fn属性只是一个别名prototype财产 The jQuery标识符或只是一个构造函数以及用它创建的所有实例都继承自构造函数的原型一个简单的构造函数
在 Vertx 中，我需要将所有 HTTP 请求重定向到相同的 URL，但对于 HTTPS

我在 Koltin 中编写了一个 Vertx web 处理程序它将我收到的任何 HTTP 请求重定向到 HTTPS 并且我正在使用context request isSSL确定请求是否不是 SSL 在我将代码放在负载均衡器后面之前这一切
Docker 容器中的 ASP.NET Core/.NET Core 控制台应用程序日志记录

如何在 docker 容器内运行的 net core 应用程序中写入日志以便日志消息显示在docker logs
如何制作动画 svg 虚线？

我尝试在 HTML SVG CSS JS 中制作动画虚线这是我的第一个 svg 动画显然我什么都不懂首先这是我的虚线
C++ 成员变量

考虑下面的类 class A A int number void setNumber int number 您可以通过 3 种方式实现 setNumber Method 1 使用 this 指针 void A setNumber int n
Jenkins 错误：未找到测试报告文件。配置错误？

我不明白为什么我会出现这个错误我已经通过 jenkins 在 Windows 上安装了 ant 我的项目叫做自由测试并保存在 C Program Files x86 Jenkins workspace test freestyle 我手动
使用正则表达式在 Python 中解析 XML

我正在尝试使用正则表达式来解析XML文件就我而言这似乎是最简单的方法例如一行可能是 line

使用正则表达式在 Python 中解析 XML

使用正则表达式在 Python 中解析 XML 的相关文章

随机推荐

热门标签