多个标签的Python正则表达式

2024-02-19

我想知道如何检索每个结果<p> tag.

import re
htmlText = '<p data="5" size="4">item1</p><p size="4">item2</p><p size="4">item3</p>'
print re.match('<p[^>]*size="[0-9]">(.*?)</p>', htmlText).groups()

result:

('item1', )

我需要的:

('item1', 'item2', 'item3')

对于此类问题,建议使用 DOM 解析器,而不是正则表达式。

我见过美丽的汤 http://www.crummy.com/software/BeautifulSoup/经常推荐用于 Python

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

多个标签的Python正则表达式 的相关文章

  • 如何等到 Excel 计算公式后再继续 win32com

    我有一个 win32com Python 脚本 它将多个 Excel 文件合并到电子表格中并将其另存为 PDF 现在的工作原理是输出几乎都是 NAME 因为文件是在计算 Excel 文件内容之前输出的 这可能需要一分钟 如何强制工作簿计算值
  • Python tcl 未正确安装

    我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
  • 没有特殊字符的密码验证器

    我是 RegEx 的新手 已经进行了大量搜索 但没有找到任何具体内容 我正在编写一个验证密码字符串的正则表达式 可接受的字符串必须至少具有 4 种字符类型中的 3 种 数字 小写字母 大写字母 特殊字符 我对包含有一个想法 也就是说 如果这
  • keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

    我目前正在使用 keras 开发 vgg16 模型 我用我的一些图层微调 vgg 模型 拟合我的模型 训练 后 我保存我的模型model save name h5 可以毫无问题地保存 但是 当我尝试使用以下命令重新加载模型时load mod
  • Python:字符串不会转换为浮点数[重复]

    这个问题在这里已经有答案了 我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
  • 如何停止TinyMCE删除span标签?

    在我的工作中 前一位程序员决定使用公司网站上精彩的TinyMCE 我遇到的数千个问题之一是 如果原文有的话span标签 当我按下退格键删除一行 p仅标签 全部span标签已从文本中删除 这个错误比另一个错误更具体 我可以删除anything
  • 当玩家触摸屏幕一侧时,如何让 pygame 发出警告?

    我使用 pygame 创建了一个游戏 当玩家触摸屏幕一侧时 我想让 pygame 给出类似 你不能触摸屏幕两侧 的错误 我尝试在互联网上搜索 但没有找到任何好的结果 我想过在屏幕外添加一个方块 当玩家触摸该方块时 它会发出警告 但这花了很长
  • Geopandas 设置几何图形:MultiPolygon“等于 len 键和值”的 ValueError

    我有 2 个带有几何列的地理数据框 我将一些几何图形从 1 个复制到另一个 这对于多边形效果很好 但对于任何 有效 多多边形都会返回 ValueError 请指教如何解决这个问题 我不知道是否 如何 为什么应该更改 MultiPolygon
  • 表单发布请求并存储收到的数据

    我有一个非常简单的表单 在提交时发出发布请求
  • Python - 按月对日期进行分组

    这是一个简单的问题 起初我认为很简单而忽略了它 一个小时过去了 我不太确定 所以 我有一个Python列表datetime对象 我想用图表来表示它们 x 值是年份和月份 y 值是此列表中本月发生的日期对象的数量 也许一个例子可以更好地证明这
  • 如何改变Python中特定打印字母的颜色?

    我正在尝试做一个简短的测验 并且想将错误答案显示为红色 欢迎来到我的测验 您想开始吗 是的 祝你好运 法国的首都是哪里 法国 随机答案不正确的答案 我正在尝试将其显示为红色 我的代码是 print Welcome to my Quiz be
  • Python 3 中“map”类型的对象没有 len()

    我在使用 Python 3 时遇到问题 我得到了 Python 2 7 代码 目前我正在尝试更新它 我收到错误 类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
  • 使用 CSS 折叠和展开元素

    我正在尝试构建一个页面 加载时仅可见标题 并且 当用户单击标题时 每个标题下方的表格会在隐藏和显示状态之间切换 我的限制是只能在 CSS 中执行此操作 这是我到目前为止想到的 https jsfiddle net Argoron c1ypx
  • 如何将 PIL 图像转换为 NumPy 数组?

    如何转换 PILImage来回转换为 NumPy 数组 这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许 我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
  • 检查所有值是否作为字典中的键存在

    我有一个值列表和一本字典 我想确保列表中的每个值都作为字典中的键存在 目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个 感觉有点像黑客 您的方
  • 用于运行可执行文件的python多线程进程

    我正在尝试将一个在 Windows 上运行可执行文件并管理文本输出文件的 python 脚本升级到使用多线程进程的版本 以便我可以利用多个核心 我有四个独立版本的可执行文件 每个线程都知道要访问它们 这部分工作正常 我遇到问题的地方是当它们
  • 如何使用google colab在jupyter笔记本中显示GIF?

    我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点 我正在使用下面的代码 它并没有在笔记本中为 gif 制作动画 我希望笔记本是交互式的 这样人们就可以看到代码的动画效果 而无需运行它 我发现很多方法在 Goo
  • 如何仅删除单括号并保留配对的括号

    你好 我亲爱的老师 R 用户朋友们 我最近开始认真学习正则表达式 最近我遇到了一种情况 我们只想保留配对括号 并省略未配对的 这是我的样本数据 structure list t1 c Book Pg 1 Website Online Jou
  • 在 Python 类中动态定义实例字段

    我是 Python 新手 主要从事 Java 编程 我目前正在思考Python中的类是如何实例化的 我明白那个 init 就像Java中的构造函数 然而 有时 python 类没有 init 方法 在这种情况下我假设有一个默认构造函数 就像
  • 改变字典的哈希函数

    按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例

随机推荐

  • 为 .NET 4 和 .NET 4.5 构建 - 引用的 NuGet 包怎么样?

    我有一个构建项目的脚本 输出 NET 4 0 程序集 该项目包括来自 NuGet 的 NLog 所以项目文件中的引用如下所示
  • 为网站构建CMS

    我有我的主站点kansasoutlawwrestling com它将使用 Codeigniter 然后我还为自己创建一个 CMS 它是一个单独的实体 位于kansasoutlawwrestling com kowmanager 我的 CMS
  • 运行 SimpleHTTPServer 时设置当前目录

    有什么方法可以设置要启动 SimpleHTTPServer 或 BaseHTTPServer 的目录吗 如果您正在使用SimpleHTTPServer直接从命令行 您可以简单地使用 shell 功能 pushd path you want
  • NumPy 沿不相交索引求和

    我有一个应用程序 需要对 3D NumPy 数组中的任意索引组进行求和 内置 NumPy 数组求和例程将沿 ndarray 维度之一的所有索引相加 相反 我需要沿着数组中的一个维度总结索引范围并返回一个新数组 例如 假设我有一个形状为 nd
  • 为 64 位项目调用 C# 中的 Javascript 函数

    我试图从 C 代码内部调用 Javascript 函数 eval 以利用运算符解析器的字符串 我使用了以下代码 https stackoverflow com a 12431435 712700 https stackoverflow co
  • 是否有与 TestNG 连接的 log4j 附加程序?

    我使用 log4j 并希望通常在我的日志记录工具中结束的日志消息出现在我的单元测试期间 TestNG 创建的测试报告中 我认为这意味着 log4jAppender输出到 TestNGListener以及我的 Maven 项目的 src te
  • 删除 URL 查询字符串中的加号 (+)

    我正在尝试让以下 URL 中的字符串显示在我的网页上 http example com ks4day 星期五 九月 13日 http example com ks4day Friday September 13th EDIT URL 中的日
  • iFrame 中的 Firebug 和 jQuery 选择器

    我正在开发一个 Web 应用程序 并使用 jQuery 插件 Colorbox 弹出一个窗口 其中显示用于编辑父窗口元素的表单 我正在使用 Firebug 来调试我的 Javascript 和 jQuery 并且我注意到我无法使用 jQue
  • Azure 队列创建最佳实践和规模

    我正在研究 Windows Azure 上的大规模 Web 性能应用程序的架构 目前是理论上的 并想请教一下您有关 Windows Azure 队列 不是 SB 以及如何最好地扩展 创建它们的知识 我基本上关注的是 MVC 前端 Web 角
  • 嵌套列表理解

    我尝试在内部列表理解中使用外部列表理解的值 x for x in range y for y in range 3 但不幸的是 这引发了NameError因为这个名字y未知 尽管外部列表理解指定了它 这是 Python 的限制 尝试过 2
  • JS:如何在回调中使用生成器和yield

    我使用 JS 生成器在回调中生成一个值setTimeout function sleep Using yield here is OK yield 5 setTimeout function Using yield here will th
  • 正则表达式匹配两个 {} 之间的所有内容

    我在这里查看了不同的答案 但不幸的是它们都不适合我的情况 所以我希望你不要介意 因此 我需要匹配两个大括号 之间的所有内容 除了匹配以 开头且没有这些大括号的情况 例如 这是一个超级文本 匹配这个 匹配这个 这是另一个例子 deal wit
  • Python 日志记录:提供主模块的日志文件路径

    有什么办法我可以提供filename我的主模块中的记录器 我正在使用以下方法 但是它不起作用 所有日志都转到xyz log文件而不是main log 根据 nosklo 的建议进行更新 记录器 py formatter logging Fo
  • 带有表格布局的表格:固定;以及如何使一列更宽

    所以我有一张这种风格的桌子 table layout fixed 这使得所有列具有相同的宽度 我想让一列 第一列 更宽 然后其余列以相等的宽度占据表格的剩余宽度 如何实现这一目标 table border collapse collapse
  • PHP 的否定检查与“!”是否对应于“!=”或“!==”?

    在 PHP 中 是 if foo 相当于 if foo true or with if foo true 或者两者是完全不同的东西 注意 OR 比较变量的值是否相等 并根据需要进行类型转换 OR 检查两个变量是否具有相同的类型并且具有相同的
  • AWS Elastic Beanstalk 中使用 PlaywrightCrawler 包时出现错误

    当尝试在我的服务器环境中使用 PlaywrightCrawler 包时 我收到以下错误日志 32mINFO 39m 33m PlaywrightCrawler 39m Starting the crawl 33mWARN 39m 33m P
  • 使用映射模板添加或更新 JSON 对象的属性 (AWS API Gateway)

    在我的 AWS APIGW Rest API 中 我尝试添加和 或更新提交的请求正文 JSON 上的属性 我能找到的每个示例都涉及构建新的 JSON 对象 而不是更新现有对象 在集成请求映射模板中 我的传入数据正文如下所示 如果发布的是新对
  • MIT App Inventor 2:模拟器无法启动伴侣

    当我跑步时aiStarter exe以管理员身份 然后单击 连接到模拟器 http ai2 appinventor mit edu http ai2 appinventor mit edu 然后模拟器启动 显示带有 android 的黑屏
  • vscode“智能感知”和“转到定义”非 js/ts 文件

    在前端开发中 我们经常不仅在 javascript 中导入 javascript typescript 文件 我们使用别名和相对路径导入此类文件 Example import brandsQuery from graphql queries
  • 多个标签的Python正则表达式

    我想知道如何检索每个结果 p tag import re htmlText p p size 4 item1 p p size 4 item2 p p size 4 item3 p print re match