BeautifulSoup find_all() 是否保留标签顺序？

2023-11-27

我希望使用 BeautifulSoup 来解析一些 HMTL。我有一张有几行的桌子。我试图找到满足某些条件（某些属性值）的行，并稍后在我的代码中使用该行的索引。

问题是：find_all()保留它返回的结果集中的行顺序？

我在中没有找到这个docs谷歌搜索让我只这个答案:

“BeautifulSoup 标签不会跟踪它们在页面中的顺序，不会。”

但他没有透露他从哪里得到这些信息。

我很高兴得到答案，但更高兴的是指向一些解释这一点的文档。

编辑：dstudeba 向我指出了这个“解决方法”的方向next_sibling.

from bs4 import BeautifulSoup
soup = BeautifulSoup(open('./mytable.html'), 'html.parser')
row = soup.find('tr', {'class':'something', 'someattr':'somevalue'})
myvalues = []
while True:
    cell = row.find('td', {'someattr':'cellspecificvalue'})
    myvalues.append(cell.get_text())
    row = row.find_next_sibling('tr', {'class':'something', 'someattr':'somevalue'})
    if not row:
        break

这会按照它们在 html 文件中出现的顺序获取我需要的单元格内容。

但是我仍然想知道在 BeautifulSoup 文档中我可以找到是否find_all()是否保留秩序。这就是为什么我不接受 dstudeba 的答案。（我的赞成票没有显示，还没有足够的代表：P）

我的经验是find_all确实维持秩序。但是为了确保您可以使用find_all_next方法使用了find_next方法将保留顺序。这是一个链接到文档。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python27

beautifulsoup

BeautifulSoup find_all() 是否保留标签顺序？的相关文章

使用 MongoDB 作为我们的主数据库，我应该使用单独的图数据库来实现实体之间的关系吗？

我们目前正在为一家专业公司内部实施类似 CRM 的解决方案由于存储信息的性质以及信息的不同值和键我们决定使用文档存储数据库因为它完全适合目的在本例中我们选择 MongoDB 作为此 CRM 解决方案的一部分我们希望存储实体之间的关
类的 IPython 表示

我正在使用我创建的模块尝试 IPython 但它没有显示类对象的实际表示相反它显示类似的内容 TheClass module TheClass name I heavily在这个模块中使用元类我有真正有意义的类表示应该向用户显示是
Pandas set_levels，如何避免标签排序？

我使用时遇到问题set levels多索引 from io import StringIO txt Name Height Age Metres A 1 25 B 95 1 df pd read csv StringIO txt heade
如何在 __init__ 中使用await设置类属性

我如何定义一个类await在构造函数或类体中例如我想要的 import asyncio some code class Foo object async def init self settings self settings setti
为什么 dataclasses.astuple 返回类属性的深层副本？

在下面的代码中astuple函数正在执行数据类的类属性的深层复制为什么它不能产生与函数相同的结果my tuple import copy import dataclasses dataclasses dataclass class Dem
NLTK 2.0分类器批量分类器方法

当我运行此代码时它会抛出一个错误我认为这是由于 NLTK 3 0 中不存在batch classify 方法我很好奇如何解决旧版本中的某些内容在新版本中消失的此类问题 def accuracy classifier gold resu
Django Rest Framework 是否有第三方应用程序来自动生成 swagger.yaml 文件？

我有大量的 API 端点编写在django rest framework并且不断增加和更新如何创建和维护最新的 API 文档我当前的版本是 Create swagger yaml文件并以某种方式在每次端点更改时自动生成然后使用此文件作
嵌套列表的重叠会产生不必要的间隙

我有一个包含三个列表的嵌套这些列表由 for 循环填充并且填充由 if 条件控制第一次迭代后它可能类似于以下示例 a 1 2 0 0 0 0 0 0 4 5 0 0 0 0 0 0 6 7 根据条件它们不重叠在第二次迭代之后新
Pycharm 在 os.path 连接上出现“未解析的引用”

将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
嵌套作用域和 Lambda

def funct x 4 action lambda n x n return action x funct print x 2 prints 16 我不太明白为什么2会自动分配给n n是返回的匿名函数的参数funct 完全等价的定义fu
Protobuf 如何编码 oneof 消息结构

对于这个 python 程序在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
PySpark groupByKey 返回 pyspark.resultiterable.ResultIterable

我试图找出为什么我的 groupByKey 返回以下内容 0
带有 LSTM 的 GridSearchCV/RandomizedSearchCV

我一直在尝试通过 RandomizedSearchCV 调整 LSTM 的超参数我的代码如下 X train X train reshape X train shape 0 1 X train shape 1 X test X test
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
重新分配唯一值 - pandas DataFrame

我在尝试着assign unique值在pandas df给特定的个人 For the df below Area and Place 会一起弥补unique不同的价值观jobs 这些值将分配给个人总体目标是使用尽可能少的个人诀窍在于这
如何将 Django 中的权限添加到模型并使用 shell 进行测试

我在模型中添加了 Meta 类并同步了数据库然后在 shell 中创建了一个对象它返回 false 所以我真的无法理解错误在哪里或者缺少什么是否在其他文件中可能存在某种配置 class Employer User Employer in
如何使用 PrimaryKeyRelatedField 更新多对多关系上的类别

Django Rest 框架有一个主键相关字段 http www django rest framework org api guide relations primarykeyrelatedfield其中列出了我的 IDmany to m
pandas.read_csv 将列名移动一倍

我正在使用位于的 ALL zip 文件here http www fec gov disclosurep PDownload do 我的目标是用它创建一个 pandas DataFrame 但是如果我跑 data pd read csv
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并

随机推荐

R：因子水平，将其余部分重新编码为“其他”

我很少使用因子通常认为它们是可以理解的但我经常对特定操作的细节感到模糊目前我正在将很少观察到的类别编码折叠到其他中并正在寻找一种快速的方法来做到这一点我有一个变量的大约 20 个级别但有兴趣将其中一堆折叠为一个 data
django 中的完全外连接

如何使用 django QuerySet API 创建跨 M2M 关系的完整外部联接的查询如果不支持欢迎一些有关创建我自己的经理来执行此操作的提示编辑添加 S 洛特感谢您的启发对 OUTER JOIN 的需求来自于应用程序它必须
如何创建具有多种视图类型的RecyclerView

From 使用 RecyclerView 创建动态列表当我们创建一个RecyclerView Adapter我们必须指定ViewHolder将与适配器绑定 public class MyAdapter extends RecyclerVi
读取JRT后如何释放所有资源？

我正在尝试使用中描述的方法读取给定 Java 9 安装中可用的模块列表给定其 Java Home 如何提取文件 jre 9 lib modules 该解决方案有效但分配用于读取 Java 运行时映像内容的资源似乎永远不会释放从而导致内
生成由文件输入在特定时间选择的视频文件的缩略图/快照

如何抓取通过以下方式选择的视频文件的快照
如何在asp.net中的gridview中创建链接

我正在尝试创建一个具有网格视图的网页这个 gridview 应该有一个如下所示的链接 http localhost Test aspx code 123 当用户单击 gridview 中的某一行链接时它将打开一个空白页面并显示一些结果
如何在 ASP.NET Core 3.1 中实现自定义 ValidateAntiforgeryTokenAuthorizationFilter

我想实现一个过滤器当身份验证令牌身份验证时该过滤器会跳过防伪令牌的验证 Bearer 用来在 ASP NET Core 2 2 中ValidateAntiforgeryTokenAuthorizationFilter and Auto
如何使用 @IfProfileValue 来测试配置文件是否处于活动状态？

如此令人困惑 IfProfileValue与以下无关 Profile or ActiveProfiles Profile测试配置文件是否处于活动状态 ActiveProfiles将它们设置为活动状态并且 IfProfileValue允许你
调用 reloadRowsAtIndexPaths 删除 tableView contentOffset

每当我打电话 reloadRowsAtIndexPaths 我的 UITableView contentOffset 被删除是否有一个委托方法可以用来捕获表视图更新并再次设置偏移量以便它保持在原位并且不会动画进入视图或者只是阻止它这样
ASP.NET - 如何仅在尚未包含 CSS 的情况下包含 CSS？

我使用下面的代码动态包含 CSS 文件 HtmlHead head HtmlHead Page Header HtmlLink link new HtmlLink link Attributes Add href Page ResolveC
分析 .Net 线程争用

是否有任何工具可用于分析 Net 线程争用我为运行缓慢的 Windows 服务添加了线程性能计数器它显示了大约 150 个线程争用我想分析一下代码的哪个区域造成了如此多的线程争用有没有可用的工具可以引导我进入正确的代码块 Visua
ReactJS 和自动对焦

我有一个react bootstrap模态与
查看/记录浏览器正在执行哪个 JavaScript 函数

有没有一种方法附加组件我每次都可以使用any例如 javascript 函数在 Firefox 中执行函数名称将被打印到控制台或任何地方这是因为我无法找到很难找到当我单击下拉菜单时执行哪个函数所以我希望 firefox add
Windows 2008：虚拟文件系统（如 FUSE）[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案我正在寻找适用于 Windows 的虚拟文件系统例如适用于 Unix 的 FUSE 有什么建议吗我看过dokan 旧港fifs并且回调文件系统但
“Hello Android”教程出现问题

我对 Eclipse 和 Android 很陌生但对 Java 有点熟悉话虽如此我尝试使用最新的 Eclipse Galieo 和 2 1 Android SDK 来遵循开发人员网站上的 Hello Android 教程我使用的是运
为什么 Python 哈希列表不使用 ID？

在Python中使用字典时以下情况是不可能的 d d 1 2 3 4 since list is an unhashable type 但是那idPython 中的函数返回一个对象的整数该整数保证在该对象的生命周期内是唯一的为什么P
强制包的函数使用用户提供的函数

我遇到了问题MNP我追踪到一个不幸的调用的包deparse 其最大宽度限制为 500 个字符背景无聊时可以轻松跳过 Because mnp使用有点特殊的语法来允许不同的选择集您包括cbind choiceA choiceB 在公式定义
Python：从命名空间中提取变量

我在 python 中使用 argparse 来解析命令行参数 parser ArgumentParser parser add argument a parser add argument b parser add argument c
如何在列表视图中添加EditText并在所有行中动态获取其值？

我在 listView 中有 Checkbox 和 EditText 以及 Textview 它从列表中获取文本视图的值复选框将被动态选中以同样的方式 EditText也可以动态输入现在我的问题是当我在编辑文本中输入文本后滚动列表视
BeautifulSoup find_all() 是否保留标签顺序？

我希望使用 BeautifulSoup 来解析一些 HMTL 我有一张有几行的桌子我试图找到满足某些条件某些属性值的行并稍后在我的代码中使用该行的索引问题是 find all 保留它返回的结果集中的行顺序我在中没有找到这个do

BeautifulSoup find_all() 是否保留标签顺序？

BeautifulSoup find_all() 是否保留标签顺序？ 的相关文章

随机推荐

热门标签

BeautifulSoup find_all() 是否保留标签顺序？的相关文章