删除网页抓取中的换行符

2023-12-25

我正在尝试抓取棒球阵容数据，但只想返回球员姓名。然而，截至目前，它给了我 - 位置、换行符、名称、换行符，然后是击球方。例如我想要

'D. Fletcher'

但我得到

'LF\nD. Fletcher\nR'

此外，它还为我提供了页面上的所有玩家。我最好按团队对它们进行分组，这可能需要设置某种字典，但不确定该代码会是什么样子。

我尝试过使用strip功能，但我相信这只消除了前导或尾随问题，而不是中间的问题。我尝试研究如何从锚标签获取标题信息，但还没有弄清楚如何做到这一点。

from bs4 import BeautifulSoup
import requests


url = 'https://www.rotowire.com/baseball/daily_lineups.htm'

r = requests.get(url)
soup = BeautifulSoup(r.text, "html.parser")

players = soup.find_all('li', {'class': 'lineup__player'})

####for link in players.find('a'):
#####   print (link.string)

awayPlayers = [player.text.strip() for player in players]
print(awayPlayers)

你应该只得到.text为了a标签，不是全部li:

awayPlayers = [player.find('a').text.strip() for player in players]

这会导致类似下面的结果：

['L. Martin', 'Jose Ramirez', 'J. Luplow', 'C. Santana', ...

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

webscraping

beautifulsoup

删除网页抓取中的换行符的相关文章

尽管极其懒惰，但如何在 Python 中模拟 IMAP 服务器？

我很好奇是否有一种简单的方法来模拟 IMAP 服务器例如imaplib模块在Python中 without做很多工作是否有预先存在的解决方案理想情况下我可以连接到现有的 IMAP 服务器进行转储并让模拟服务器在真实的邮箱电子
将字符串转换为带有毫秒和时区的日期时间 - Python

我有以下 python 片段 from datetime import datetime timestamp 05 Jan 2015 17 47 59 000 0800 datetime object datetime strptime t
如何生成给定范围内的回文数列表？

假设范围是 1 X 120 这是我尝试过的 gt gt gt def isPalindrome s check if a number is a Palindrome s str s return s s 1 gt gt gt def ge
如何在android上的python kivy中关闭应用程序后使服务继续工作

我希望我的服务在关闭应用程序后继续工作但我做不到我听说我应该使用startForeground 但如何在Python中做到这一点呢应用程序代码 from kivy app import App from kivy uix floatl
如何打印没有类型的defaultdict变量？

在下面的代码中 from collections import defaultdict confusion proba dict defaultdict float for i in xrange 10 confusion proba di
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
安装后 Anaconda 提示损坏

我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是安装后当我关闭提示窗口并打开新航站楼弹出
从 scikit-learn 导入 make_blobs [重复]

这个问题在这里已经有答案了我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
循环中断打破tqdm

下面的简单代码使用tqdm https github com tqdm tqdm在循环迭代时显示进度条 import tqdm for f in tqdm tqdm range 100000000 if f gt 100000000 4 b
Numpy 优化

我有一个根据条件分配值的函数我的数据集大小通常在 30 50k 范围内我不确定这是否是使用 numpy 的正确方法但是当数字超过 5k 时它会变得非常慢有没有更好的方法让它更快 import numpy as np N 5000
为美国东部以外地区的 Cloudwatch 警报发送短信？

AWS 似乎没有为美国东部以外的 SNS 主题订阅者提供 SMS 作为协议我想连接我的 CloudWatch 警报并在发生故障时接收短信但无法将其发送到 SMS YES 经过一番挖掘后我能够让它发挥作用它比仅仅选择一个主题或输入闹钟
在python中，如何仅搜索所选子字符串之前的一个单词

给定文本文件中的长行列表我只想返回紧邻其前面的子字符串例如单词狗描述狗的单词例如假设有这些行包含狗 hotdog big dog is dogged dog spy with my dog brown dogs 在这种情况下期望
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar
Pandas 与 Numpy 数据帧

看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组否则我们的代码将无法工作我知道 pandas Data

随机推荐

在 python 中列出带有标题的 csv [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我编写了一个脚本其中给出了如下所示的列表作为输出 red 361 0 blue 1 0 orange 77 0 cream 66
导入样式表中的 XSLT 样式表参数

是否可以为导入的样式表的参数赋值我期待类似的事情
如何使用 Perl 且仅使用 LWP::UserAgent 更新我的 Twitter 状态？

我正在尝试通过 Twitter API 和 OAuth 更新我的状态我陷入了最后一步即状态更新这是我的代码标题 ua gt default header Content Type gt application x www form
堆叠两个 pandas 数据框

如何堆叠以下 2 个数据框 df1 hzdept r hzdepb r sandtotal r 0 0 114 0 1 114 152 92 1 df2 hzdept r hzdepb r sandtotal r 0 0 23 83 5 1
pandas 中按列随机排列行

我有以下数据框示例 c1 c2 0 1 a 1 2 b 2 3 c 3 4 d 4 5 e 给定一个模板c1 3 2 5 4 1 我想根据新的列顺序更改行的顺序c1 所以它看起来像 c1 c2 0 3 c 1 2 b 2 5 e 3 4 d
如何判断文件是否已完成 FTP 传输？

我们有一个 C Windows 服务轮询一个文件夹等待 FTP 文件被发布为了避免在文件仍在写入时使用该文件我们首先尝试锁定该文件但是似乎有有时我们会在创建 FTP 文件之后但在写入文件之前锁定文件因此我们最终会打开一个空文件
在 GEKKO 中使用非线性模型预测控制实现横向控制器

我正在尝试为由横向动态模型定义的自动驾驶车辆实现横向控制器好吧我的问题是 CV 没有达到 SP 设置的所需参考点或目标点我正在使用以下运动方程和目标函数我正在使用半经验公式 pacejka 来计算 Fyf Fyr 提供的轮胎力这里
对于 DataGridView，如何获取每一行的值？

我想知道迭代 datagridview 中的所有行并从单元格中获取值的最佳方法是什么这是我想做的但我不太喜欢它因为如果我重新排列列那么代码也必须更改 for int i 0 i lt dataGridView RowCount i
C# EF 5 Code First 中多对多关系的 Lambda 表达式

我正在使用 EF 5 Code First 和 VS 2012 我有文章和标签课程每一篇文章都会有至少一个关联的标签请参阅下面的课程 public class Article public int ArticleId get set p
使用 C# 以编程方式更新 MS Access 数据库中的链接表

我有两个 Access 2003 数据库 fooDb and barDb 里面有四张桌子fooDb链接到表中的barDb 两个问题如何更新表内容链接表在fooDb应与表中的内容同步barDb 如何将表重新链接到不同的表barDb usi
在 Ruby on Rails 中生成多对多模型

有没有办法生成预定义多对多关系的 Rails 模型我知道如何在事后将其添加到 Active Record 但最好立即在数据库迁移和 Active Record 模型中定义它请记住您不需要连接表的 id 因此请确保添加 id gt fa
在 Chartjs 中显示饼图之外的值

When I hover on pie chart the values are displayed in tooltip However I want to display values outside of pie chart I wa
使用对象数组创建嵌套列表

我有一组会经常更改的 SQL 数据我需要定期从中创建一个嵌套的无序列表我已将 SQL 数据转换为对象数组但我仍停留在从中创建无序列表的逻辑上我尝试制作一个递归函数但我对这些函数的经验还不够所以数据包含以下字段 ID Categ
如何使用 spring data mongodb 聚合在组中使用总和和条件

db test aggregate group id id total sum 1 live sum cond if eq status A then 1 else 0 chat hrs avg subtract end time star
R中的前向和后向填充数据帧[重复]

这个问题在这里已经有答案了我有一个数据框其中的数据如下 Col1 Col2 20 NA 25 NA 15 NA NA 10 NA 15 等等我希望将其重塑如下 Col1 Col2 20 10 25 10 15 10 15 10 15
在 Excel 中，如何以编程方式编辑包含超链接的单元格区域中的地址？

我有一列包含超链接我想以编程方式搜索并替换超链接地址地址本身而不是要显示的文本我该怎么做呢通过修改范围对象的超链接元素的地址属性超链接是一个集合因此如果您的范围是单个单元格您将选择第一项但它允许您轻松循环遍历给定范围或
将所有绘图输出重定向到特定文件

我想自动重定向all绘制到文件原因见下文有没有一种非 hacky 的方法来实现这一点缺少这一点我实际上并不害怕覆盖内置函数我that绝望的我能想到的最简单的方法是连接到基本的绘图窗口创建函数并调用pdf 然后连接到绘图完成函数
Firebase 如何保护数字数据免遭用户操纵，例如。比赛得分

我正在使用 Firebase 开发一款多人游戏每场比赛结束后玩家得分都会记录在 firebase 中并且playerTotalScore 字段也会更新为新的总分我的问题是否可以仅使用 firebase 安全规则来保护 player
当我们定义柯里化风格的函数时，我们可以声明参数的类型吗？

如果我定义一个带有元组样式参数的函数我可以定义参数类型和返回类型 fun hello name String code int String hello 但如果我使用咖喱风格我只能这样做 fun hello name code hell
删除网页抓取中的换行符

我正在尝试抓取棒球阵容数据但只想返回球员姓名然而截至目前它给了我位置换行符名称换行符然后是击球方例如我想要 D Fletcher 但我得到 LF nD Fletcher nR 此外它还为我提供了页面上的所有玩家我最好

删除网页抓取中的换行符

删除网页抓取中的换行符 的相关文章

随机推荐

热门标签

删除网页抓取中的换行符的相关文章