删除网页抓取中的换行符

2023-12-25

我正在尝试抓取棒球阵容数据,但只想返回球员姓名。然而,截至目前,它给了我 - 位置、换行符、名称、换行符,然后是击球方。例如我想要

'D. Fletcher'

但我得到

'LF\nD. Fletcher\nR'

此外,它还为我提供了页面上的所有玩家。我最好按团队对它们进行分组,这可能需要设置某种字典,但不确定该代码会是什么样子。

我尝试过使用strip功能,但我相信这只消除了前导或尾随问题,而不是中间的问题。我尝试研究如何从锚标签获取标题信息,但还没有弄清楚如何做到这一点。

from bs4 import BeautifulSoup
import requests


url = 'https://www.rotowire.com/baseball/daily_lineups.htm'

r = requests.get(url)
soup = BeautifulSoup(r.text, "html.parser")

players = soup.find_all('li', {'class': 'lineup__player'})

####for link in players.find('a'):
#####   print (link.string)

awayPlayers = [player.text.strip() for player in players]
print(awayPlayers)

你应该只得到.text为了a标签,不是全部li:

awayPlayers = [player.find('a').text.strip() for player in players]

这会导致类似下面的结果:

['L. Martin', 'Jose Ramirez', 'J. Luplow', 'C. Santana', ...
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

删除网页抓取中的换行符 的相关文章

随机推荐

  • 在 python 中列出带有标题的 csv [关闭]

    Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案 我编写了一个脚本 其中给出了如下所示的列表作为输出 red 361 0 blue 1 0 orange 77 0 cream 66
  • 导入样式表中的 XSLT 样式表参数

    是否可以为导入的样式表的参数赋值 我期待类似的事情
  • 如何使用 Perl 且仅使用 LWP::UserAgent 更新我的 Twitter 状态?

    我正在尝试通过 Twitter API 和 OAuth 更新我的状态 我陷入了最后一步 即状态更新 这是我的代码 标题 ua gt default header Content Type gt application x www form
  • 堆叠两个 pandas 数据框

    如何堆叠以下 2 个数据框 df1 hzdept r hzdepb r sandtotal r 0 0 114 0 1 114 152 92 1 df2 hzdept r hzdepb r sandtotal r 0 0 23 83 5 1
  • pandas 中按列随机排列行

    我有以下数据框示例 c1 c2 0 1 a 1 2 b 2 3 c 3 4 d 4 5 e 给定一个模板c1 3 2 5 4 1 我想根据新的列顺序更改行的顺序c1 所以它看起来像 c1 c2 0 3 c 1 2 b 2 5 e 3 4 d
  • 如何判断文件是否已完成 FTP 传输?

    我们有一个 C Windows 服务轮询一个文件夹 等待 FTP 文件被发布 为了避免在文件仍在写入时使用该文件 我们首先尝试锁定该文件 但是 似乎有有时我们会在创建 FTP 文件之后但在写入文件之前锁定文件 因此我们最终会打开一个空文件
  • 在 GEKKO 中使用非线性模型预测控制实现横向控制器

    我正在尝试为由横向动态模型定义的自动驾驶车辆实现横向控制器 好吧 我的问题是 CV 没有达到 SP 设置的所需参考点或目标点 我正在使用以下运动方程和目标函数 我正在使用半经验公式 pacejka 来计算 Fyf Fyr 提供的轮胎力 这里
  • 对于 DataGridView,如何获取每一行的值?

    我想知道迭代 datagridview 中的所有行并从单元格中获取值的最佳方法是什么 这是我想做的 但我不太喜欢它 因为如果我重新排列列 那么代码也必须更改 for int i 0 i lt dataGridView RowCount i
  • C# EF 5 Code First 中多对多关系的 Lambda 表达式

    我正在使用 EF 5 Code First 和 VS 2012 我有文章和标签课程 每一篇文章都会有至少一个关联的标签 请参阅下面的课程 public class Article public int ArticleId get set p
  • 使用 C# 以编程方式更新 MS Access 数据库中的链接表

    我有两个 Access 2003 数据库 fooDb and barDb 里面有四张桌子fooDb链接到表中的barDb 两个问题 如何更新表内容 链接表在fooDb应与表中的内容同步barDb 如何将表重新链接到不同的表barDb usi
  • 在 Ruby on Rails 中生成多对多模型

    有没有办法生成预定义多对多关系的 Rails 模型 我知道如何在事后将其添加到 Active Record 但最好立即在数据库迁移和 Active Record 模型中定义它 请记住 您不需要连接表的 id 因此请确保添加 id gt fa
  • 在 Chartjs 中显示饼图之外的值

    When I hover on pie chart the values are displayed in tooltip However I want to display values outside of pie chart I wa
  • 使用对象数组创建嵌套列表

    我有一组会经常更改的 SQL 数据 我需要定期从中创建一个嵌套的无序列表 我已将 SQL 数据转换为对象数组 但我仍停留在从中创建无序列表的逻辑上 我尝试制作一个递归函数 但我对这些函数的经验还不够 所以 数据包含以下字段 ID Categ
  • 如何使用 spring data mongodb 聚合在组中使用总和和条件

    db test aggregate group id id total sum 1 live sum cond if eq status A then 1 else 0 chat hrs avg subtract end time star
  • R中的前向和后向填充数据帧[重复]

    这个问题在这里已经有答案了 我有一个数据框 其中的数据如下 Col1 Col2 20 NA 25 NA 15 NA NA 10 NA 15 等等 我希望将其重塑如下 Col1 Col2 20 10 25 10 15 10 15 10 15
  • 在 Excel 中,如何以编程方式编辑包含超链接的单元格区域中的地址?

    我有一列包含超链接 我想以编程方式搜索并替换超链接地址 地址本身 而不是要显示的文本 我该怎么做呢 通过修改范围对象的超链接元素的 地址 属性 超链接是一个集合 因此如果您的范围是单个单元格 您将选择第一项 但它允许您轻松循环遍历给定范围或
  • 将所有绘图输出重定向到特定文件

    我想自动重定向all绘制到文件 原因 见下文 有没有一种非 hacky 的方法来实现这一点 缺少这一点 我实际上并不害怕覆盖内置函数 我that绝望的 我能想到的最简单的方法是连接到基本的绘图窗口创建函数并调用pdf 然后连接到绘图完成函数
  • Firebase 如何保护数字数据免遭用户操纵,例如。比赛得分

    我正在使用 Firebase 开发一款多人游戏 每场比赛结束后 玩家得分都会记录在 firebase 中 并且playerTotalScore 字段也会更新为新的总分 我的问题 是否可以仅使用 firebase 安全规则来保护 player
  • 当我们定义柯里化风格的函数时,我们可以声明参数的类型吗?

    如果我定义一个带有元组样式参数的函数 我可以定义参数类型和返回类型 fun hello name String code int String hello 但如果我使用咖喱风格 我只能这样做 fun hello name code hell
  • 删除网页抓取中的换行符

    我正在尝试抓取棒球阵容数据 但只想返回球员姓名 然而 截至目前 它给了我 位置 换行符 名称 换行符 然后是击球方 例如我想要 D Fletcher 但我得到 LF nD Fletcher nR 此外 它还为我提供了页面上的所有玩家 我最好