我尝试使用 BeautifulSoup 通过输入下拉菜单从网络上抓取数据
这是价值下降
<selected name="try">
<option value="G1">1</option>
<option value="G2">2</option>
</selected>
我尝试这样
soup = BeautifulSoup(url, 'html.parser')
soup['selected'] = 'G1'
data = soup.findAll("table", {"style": "font-size:14px"})
print(data)
它将获取数据<table>
标记每个提交下拉列表
但它只出现<table>
对于主页,如何从每个下拉列表中获取数据?
Try an 属性CSS 选择器
soup.select('option[value]')
The []
是一个属性选择器。这寻找option
标签元素与value
属性。如果有一个可以使用的父类/id,那么在页面上有更多可用下拉列表的情况下会很有帮助。
items = soup.select('option[value]')
values = [item.get('value') for item in items]
textValues = [item.text for item in items]
与父母一起name
属性限制为一个下拉列表(希望 - 您需要测试并查看是否需要进一步的操作来充分限制)。与使用后代组合器:
items = soup.select('[name=try] option[value]')
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)