如何通过匹配 BeautifulSoup 中元素属性中的文本来获取元素

2023-12-01

我有这个代码

<a title="Next Page - Results 1 to 60 " href="bla bla" class="smallfont" rel="next">&gt;</a>

我想抓住a元素并获取 href 。

我怎样才能匹配title属性与Next Page

我想部分匹配标题属性中的文本a元素。

有许多a页面上的标签与其类似，但唯一的区别是title属性包含"Next Page或者文本是>.

您必须使用正则表达式来完成您想要的事情。

首先将整个标记作为字符串并制作BeautifulSoup反对它。

然后使用.findAll的方法BeautifulSoup对象如下

import BeautifulSoup
import re

soup = BeautifulSoup('<a title="Next Page - Results 1 to 60 " href="bla bla" class="smallfont" rel="next">&gt;</a>')

elements = soup.findAll('a', {'title':re.compile('Next Page.')}) 
# get all 'a' elements with 'title' attribute as 'Next Page something' into a list

for e in elements:
    if str(e.string) == '>' or e.string == '&gt;': # check if string inside 'a' tag is '>'
        print e['href']

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

beautifulsoup

如何通过匹配 BeautifulSoup 中元素属性中的文本来获取元素的相关文章

如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
为 pandas 数据透视表中的每个值列定义 aggfunc

试图生成具有多个值列的数据透视表我知道我可以使用 aggfunc 按照我想要的方式聚合值但是如果我不想对两列求和或求平均值而是想要一列的总和同时求另一列的平均值该怎么办那么使用 pandas 可以做到这一点吗 df pd D
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
运行多个 scrapy 蜘蛛的正确方法

我只是尝试使用在同一进程中运行多个蜘蛛新的 scrapy 文档 http doc scrapy org en 1 0 topics practices html但我得到 AttributeError CrawlerProcess objec
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
在pyyaml中表示具有相同基类的不同类的实例

我有一些单元测试集希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求但测试属于不同的套装结果有不同的父类这是我所拥有的示例 gt gt gt rz shorthand for
Geopandas 设置几何图形：MultiPolygon“等于 len 键和值”的 ValueError

我有 2 个带有几何列的地理数据框我将一些几何图形从 1 个复制到另一个这对于多边形效果很好但对于任何有效多多边形都会返回 ValueError 请指教如何解决这个问题我不知道是否如何为什么应该更改 MultiPolygon
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
如何将 numpy.matrix 提高到非整数幂？

The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
在Python中重置生成器对象

我有一个由多个yield 返回的生成器对象准备调用该生成器是相当耗时的操作这就是为什么我想多次重复使用生成器 y FunctionWithYield for x in y print x here must be something t
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
如何将数组列表转换为 Spark 数据帧

假设我有一个列表 x 1 10 2 14 3 17 我想转换x具有两列的 Spark 数据框id 1 2 3 和value 10 14 17 我怎么能这么做呢 Thanks x 1 10 2 14 3 17 df sc paralleliz
如何将列表列表中的元素转换为小写？ [复制]

这个问题在这里已经有答案了我正在尝试将列表列表的元素转换为小写这就是看起来的样子 print dataset It went Through my shirt And came out The back and hit the kid
使用 SQLAlchemy 时出现“NoneType”对象没有属性“get”错误

我一直在尝试使用 SQLAlchemy 将对象映射到数据库但遇到了障碍 Edit Basically changed a whole bunch of stuff 版本信息如果方便的话操作系统 Mac OSX 10 5 8 Pytho
如何在 py_function 之后重塑（图像，标签）数据集

我正在尝试读取自定义映射数据集进行训练但是在使用 py function 映射数据集后我得到了未知的形状例如 def process path file path label get label file path img tf io
Python：删除字符串开头的数字

我有一些这样的字符串 string1 123 123 This is a string some other numbers string2 1 This is a string some numbers string3 12 3 12 T
Python str.format() 方法的默认 kwarg 值

我希望尝试使现有字符串的复数化尽可能简单并且想知道是否有可能得到str format 在查找 kwargs 时解释默认值这是一个例子 string number of sheep sheep has run away dict comp

随机推荐

隐藏/显示的 AsyncFileUpload 控件不会触发服务器端 UploadedComplete 事件

我最近在最新版本 3 0 40412 的 ASP Net Ajax Control Toolkit 中发现了 AsyncFileUpload 控件在稍后显示的隐藏控件中使用它时似乎存在问题例如 div 标记为visible false
如何在JSF中创建h:commandButton来打开新页面

我想在 JSF 页面中创建命令按钮当我按下它时我想打开一个新页面并使用 http 发送一个值我测试了这个h commnadButton但它不起作用
如何“压缩”或“旋转”可变数量的列表？

如果我有一个包含任意数量列表的列表如下所示 var myList new List
HikariCP 与 PostgreSQL：setQueryTimeout(int) 尚未实现

我尝试将 HikariCP 与 PostgreSQL 一起使用但它不起作用它抛出一个异常 WARN 2014 10 24 14 38 54 195 com zaxxer hikari pool HikariPool Exception
为什么使用 python selenium 执行_script("return document.body.scrollHeight") 返回0

在此输入图像描述下面是我的Python代码 get 运作良好但表演完之后execute script return document body scrollHeight lastHeight回报0 chromedriver 网页上没有任
Android - 打开跟踪文件时出错：没有这样的文件或目录(2)

我正在开发一个android应用程序其中一部分是检查手机的wifi是否启用我直接在手机上运行该应用程序这些是一些错误 error opening trace file No such file or directory 2 Refus
“使用操作码 153；此模拟器仅支持最多 152”

我是二郎和牛仔的新手我正在尝试一个非常简单的例子https ninenines eu docs en cowboy 2 0 guide getting started 但我已经陷入困境了完成 make run 后我得到 mess ser
从破折号的下拉列表中过滤行后显示数据表

我是达世币新手我想制作一个应用程序我可以在其中从下拉过滤器中选择值过滤数据集并显示数据表我正在使用 dash table 我的示例应用程序代码如下没有显示数据表有谁知道我做错了什么如何在仪表板应用程序中渲染仪表板 import
片段中的选项卡视图

我一直在尝试在片段内使用选项卡视图但是通过导航栏访问它时出现了一些错误第一次访问它时我可以自由地从选项卡移动到选项卡但是当再次访问此页面时从另一个片段选项卡不再移动我只卡在单个选项卡中默认情况下仅显示第一个选项卡请帮忙这是
R 中截距回归模型的 abline 线不正确

给出了可重现的示例在下面我得到一条 y 截距约为 30 的 abline 线但回归表明 y 截距应该是 37 2851 我哪里错了 mtcars mpg 21 0 21 0 22 8 21 4 32 obs mtcars wt 2 6
如何将参数从一个 Perl 脚本传递到另一个？

我有一个运行的脚本运行后它有一些信息需要传递给下一个要运行的脚本 Unix DOS 命令如下 perl x s param send pl perl x s param receive pl param send pl 是 Send pa
Java 9：什么是集合工厂方法？ [关闭]

Closed 这个问题需要多问focused 目前不接受答案 Java 9 的到来为 Java 的 Collections API 带来了许多新功能其中之一就是集合工厂方法它们是什么以及我如何正确实施它们 Note 1 To preve
仅使用C语言的分布式系统设计

我的工作是实现一个分布式节点系统如 p2p 节点每个节点比如 A B C 和 D 执行某些功能并且需要彼此交互以进行各种操作例如同步操作和其他操作例如 15 个 A 节点与一组 5 个 B 节点交互进入负载最少的节点队列并获取令
检测图像中的字体

我有一个非常奇怪的要求即应该检测 JPG 图像中文本的字体如何做呢我想知道有什么办法可以做到这一点提前致谢您可以尝试这些服务什么字体我认为这是识别图像中字体的最准确的服务不是完全自动化的并且有限制它只会匹配 MyFonts
如何在 GitHub 上进行快进合并？

因此我的一位同事尝试使用 GitHub 的 Web 界面中的通过快进合并选项来合并分支以保持历史记录免受虚假合并提交的影响 master自要合并的功能分支启动以来它们合并到的分支尚未取得进展有趣的是这并没有按预期工作所有提交
为什么我不能将 C# 方法声明为虚拟方法和静态方法？

我有一个辅助类它只是一堆静态方法并且想对辅助类进行子类化有些行为是唯一的具体取决于子类因此我想从基类调用虚拟方法但由于所有方法都是静态的我无法创建普通的虚拟方法需要对象引用才能访问虚拟方法有没有办法解决我想我可以使用单例
从 JsRender 中的嵌套块访问父变量

我怎样才能访问props s key来自嵌套的for props object items key for prop other items key here I want to print the key from props 我试过了
配置 Eclipse 以在工作区外部添加 buildpath 文件夹

我正在 Mac 上开发 PHP 根据其他建议我已将工作区设置在 MAMP 的 HTDOCS 文件夹中不幸的是这意味着我不能像在生产中那样使用的链接有什么建议么相关地工作区似乎阻止引用工作区外部的构建路径但我想将敏感文件保留在
jQuery：我可以自动将插件应用到动态添加的元素吗？

我正在将我的 Web 应用程序转换为完全 AJAX 架构我有一个最初加载的母版页和一个加载动态内容的 div 容器我创建了一些 jQuery 插件将它们应用于某些元素以扩展它们的功能我通常会在每个页面加载期间按如下方式调用这些函数
如何通过匹配 BeautifulSoup 中元素属性中的文本来获取元素

我有这个代码 a title Next Page Results 1 to 60 href class smallfont gt a 我想抓住a元素并获取 href 我怎样才能匹配title属性与Next Page 我想部分匹配标题属性中的

如何通过匹配 BeautifulSoup 中元素属性中的文本来获取元素

如何通过匹配 BeautifulSoup 中元素属性中的文本来获取元素 的相关文章

随机推荐

热门标签

如何通过匹配 BeautifulSoup 中元素属性中的文本来获取元素的相关文章