我正在尝试抓取棒球阵容数据,但只想返回球员姓名。然而,截至目前,它给了我 - 位置、换行符、名称、换行符,然后是击球方。例如我想要
'D. Fletcher'
但我得到
'LF\nD. Fletcher\nR'
此外,它还为我提供了页面上的所有玩家。我最好按团队对它们进行分组,这可能需要设置某种字典,但不确定该代码会是什么样子。
我尝试过使用strip
功能,但我相信这只消除了前导或尾随问题,而不是中间的问题。我尝试研究如何从锚标签获取标题信息,但还没有弄清楚如何做到这一点。
from bs4 import BeautifulSoup
import requests
url = 'https://www.rotowire.com/baseball/daily_lineups.htm'
r = requests.get(url)
soup = BeautifulSoup(r.text, "html.parser")
players = soup.find_all('li', {'class': 'lineup__player'})
####for link in players.find('a'):
##### print (link.string)
awayPlayers = [player.text.strip() for player in players]
print(awayPlayers)
你应该只得到.text
为了a
标签,不是全部li
:
awayPlayers = [player.find('a').text.strip() for player in players]
这会导致类似下面的结果:
['L. Martin', 'Jose Ramirez', 'J. Luplow', 'C. Santana', ...
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)