如何访问所有 URL 的 Selenium Python

2024-03-22

我试图访问所有显示的网址，但它首先访问而不是所有

谷歌搜索网址

    browser.get('https://www.google.co.uk/search?q=Rashmi&oq=Rashmi&aqs=chrome..69i57j69i60l3.6857j0j1&sourceid=chrome&ie=UTF-8#q=Rashmi+Custom+Tailors')
    time.sleep(5)

    try:        
        p_links = browser.find_elements_by_css_selector(' div > h3 > a')
        url_list = []
        for urls in p_links:
            if "Rashmi Custom Tailors" in urls.text:

                url = urls.get_attribute("href")
                url_list.append(url)
                for url in url_list:
                    browser.get(url)
                    time.sleep(4)

    except:
        pass

你的问题是你的结果不好的做法通过使用：

try:
   do something
except:
    pass

通过这行代码块，您无法捕获有关程序为何按预期运行的任何信息。它抛出的异常可以帮助您改进代码，不要像这样忽略它。

现在，回到你的问题。在您的代码中，存在一些逻辑错误，例如@穆罕默德·拉基布·阿明的回答 https://stackoverflow.com/a/43400417/6597344。因此，对您的代码进行一些更改，您会得到以下结果：

from selenium import webdriver
browser = selenium.Chrome()
browser.get('https://www.google.co.uk/search?q=Rashmi&oq=Rashmi&aqs=chrome..69i57j69i60l3.6857j0j1&sourceid=chrome&ie=UTF-8#q=Rashmi+Custom+Tailors')
time.sleep(5)
p_links = browser.find_elements_by_css_selector(' div > h3 > a')
for urls in p_links:
    if "Rashmi Custom Tailors" in urls.text:
        url = urls.get_attribute("href")
        browser.get(url)
        time.sleep(4)

但这并没有解决你的问题，你的浏览器只会访问第一个网址就像您所描述的那样并引发异常：

StaleElementReferenceException: Message: stale element reference: element is not attached to the page document

抛出此异常是因为在第二次循环期间，您正在使用的元素不再附加到浏览器的当前页面。

解决方案就像您所做的那样，找到所有元素并将所有 url 添加到列表中。你像这样迭代列表，它在我的计算机上运行良好。尝试一下：

from selenium import webdriver

browser = webdriver.Chrome()
query_url = "https://www.google.co.uk/search?q=Rashmi&oq=Rashmi&aqs=chrome..69i57j69i60l3.6857j0j1&sourceid=chrome&ie=UTF-8#q=Rashmi+Custom+Tailors"
browser.get(query_url)
p_links = browser.find_elements_by_css_selector("div > h3 > a")
urls = []
for elem in p_links:
    text = elem.text
    url = elem.get_property('href')
    if "Rashmi Custom Tailors" in elem.text:
        urls.append(url)

for url in urls:
    browser.get(url)

也许你做了一些indent error在你的第二个循环中。

P.S：您的问题应该包含所需的所有代码，这样其他人可以更轻松地帮助您。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

selenium

如何访问所有 URL 的 Selenium Python 的相关文章

Python Nose 导入错误

我似乎无法理解鼻子测试框架 https nose readthedocs org en latest 识别文件结构中测试脚本下方的模块我已经设置了演示该问题的最简单的示例下面我会解释一下这是包文件结构 init py foo py t
编辑 scikit-learn 决策树

我想编辑 sklearn DecisionTree 例如改变条件或切割节点叶子等但似乎没有功能可以做到这一点如果我可以导出到文件编辑它以导入如何编辑决策树环境 Windows 10 python3 3 sklearn 0 17
Python的reduce()短路了吗？

If I do result reduce operator and False 1000 得到第一个结果后它会停止吗自从False anything False 相似地 result reduce operator or True 10
如何找到列表S的所有分区为k个子集（可以为空）？

我有一个唯一元素列表比方说 1 2 我想将其拆分为 k 2 个子列表现在我想要所有可能的子列表 1 2 1 2 2 1 1 2 我想分成 1 1 2 我怎样才能用 Python 3 做到这一点更新我的目标是获取 N 个唯一数字列表的
Pyspark 数据框逐行空列列表

我有一个 Spark 数据框我想创建一个新列其中包含每行中具有 null 的列名称例如原始数据框是 col 1 col 2 col 3 62 45 null 62 49 56 45 null null null null null
如何使用循环将十进制转换为二进制？

我想编写一个程序将十进制数 0 到 9 转换为二进制数我可以编写如何使用重复除法将十进制数转换为二进制数的代码但是我在创建一个以二进制格式打印十进制数字 0 到 9 的循环时遇到了麻烦这是我的代码 number 0 remaind
为 Networkx 图添加标题？

我希望我的代码创建一个带有标题的图使用下面的代码可以创建绘图但没有标题有人可以告诉我我做错了什么吗 import pandas as pd import networkx as nx from networkx algorithms
错误：无法访问文件“$libdir/plpython2”：没有这样的文件或目录

我正在运行 postgresql 9 4 PostgreSQL 9 4 4 on x86 64 unknown linux gnu compiled by gcc GCC 4 1 2 20070626 Red Hat 4 1 2 14 64
一行Python和SQLite代码，为什么需要加“，”？ [复制]

这个问题在这里已经有答案了 c execute INSERT INTO numbers VALUES random randint 0 100 如果我将上面的代码更改为 c execute INSERT INTO numbers VALUE
杂乱的扭曲连接在不干净的时尚中消失了。没有代理。已经尝试过标题

我正在尝试抓取这个网站 https www5 apply2jobs com jupitermed ProfExt index cfm fuseaction mExternal searchJobs https www5 apply2jobs
pip 安装软件包两次

不幸的是我无法重现它但我们已经见过几次了 pip 将一个软件包安装两次如果卸载第一个第二个就会可见并且也可以被卸载我的问题如果一个包安装了两次如何用 python 检查背景我想编写一个测试来检查这一点 devOp Updat
一起使用 Flask 和 Tornado？

我是以下的忠实粉丝Flask 部分是因为它很简单部分是因为它有很多扩展 http flask pocoo org extensions 然而 Flask 是为了在 WSGI 环境中使用而设计的而 WSGI 不是非阻塞的所以我相信它
如何检查列表是否为空？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动例如如果通过以下内容 a 我如何检查是否a是空的 if not a print Lis
如何在 Python 中从 HTML 页面中提取 URL [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我必须用Python 编写一个网络爬
从另一个 python 脚本获取返回信息

我在 Linux 上我有一个 python 脚本我想从另一个 python 脚本调用它我不想将其作为模块导入为了一层安全性现在为了学术练习因为我想弄清楚这一点我实际上想让一个脚本使用 os system 或另一个类似的函数并
最小硬币找零问题——回溯

我正在尝试用最少数量的硬币解决硬币找零问题采用回溯法我实际上已经完成了它但我想添加一些选项按其单位打印硬币数量而不仅仅是总数这是我下面的Python代码 def minimum coins coin list change mi
如何使用Featuretools按列值从单个数据框中的多个列创建特征？

我正在尝试根据之前的结果来预测足球比赛的结果我在 Windows 上运行 Python 3 6 并使用 Featuretools 0 4 1 假设我有以下代表结果历史记录的数据框原始数据框 https i stack imgur com
从数据集的给定日期范围中提取属于一天的数据

我有一个数据集日期范围为 2018 年 1 月 12 日到 8 月 3 日其中包含一些值维数为my df数据框是 my df shape 9752 2 每行包含半小时频率第一行开始于2018 01 12 my df iloc 0 D
为什么用字符串和时间增量转置 DataFrame 会转换数据类型？

这种行为对我来说似乎很奇怪 id列字符串在转置后转换为时间戳df如果另一列是时间增量 import pandas as pd df pd DataFrame id 00115 01222 32333 val 12 14 170 df v
从 pandas 数据框中绘制堆积条形图

我有数据框 payout df head 10 复制以下 Excel 绘图的最简单最智能和最快的方法是什么我尝试过不同的方法但无法让一切都到位 Thanks 如果您只想要一个堆积条形图那么一种方法是使用循环来绘制数据框中的每一列并

随机推荐

Excel VBA：运行时错误（对象“范围”的方法“值”失败），但仅限于连续运行

我目前正在处理的 VBA 项目遇到问题特别是一段代码的运行时错误该代码查找表格底部的下一个空单元格并将存储的字符串写入该范围现在该项目的快速解释我在 Excel 工作表中有一个表格记录了我工作的公司可能即将出现的每项预期工作为
使用 apache poi 超链接到同一工作簿中的不同工作表

我正在使用 Apache POI 生成包含多个工作表的 Excel 工作簿我想创建从一张纸到另一张纸的超链接如何做到这一点我找到了一些解决方案可以建立指向网站的超链接甚至可以建立其他 Excel 文件的超链接但不能建立指向同一工
C3/D3 饼图图例格式/标签重叠

我有一个使用 C3 的饼图我现在通过添加值和百分比更改了默认图例名称我正在寻找一种方法来很好地格式化这个图例以便值和百分比像列一样定位有没有办法防止标签重叠这是我到目前为止所取得的进展 var columns data11 dat
如何在没有函数的情况下通过引用传递数组？迅速

我有这门课 class MainView UIView var categories Category 我想设置类别参数但我需要通过引用而不是值传递它因为它更高效更好所以如果我这样做 let mainView MainView ma
在 iOS 上组合相交的 CGPath

我正在开发的应用程序遇到问题假设我有两个相当复杂的 CGPath 我将它们都添加到 CGMutablePath 从而将它们组合起来好吧两条路径相交的地方就会有彼此内部的点我想消除那些内部点并基本上绘制路径的外部或轮廓我很难弄清楚我
如何将 Android Activity 转换为界面？

在 Android 文档中 http developer android com guide components fragments html http developer android com guide components fra
MVC-Mini-Profiler 错误地显示重复查询

我一直在尝试 MVC Mini Profiler 发现它非常有用但是在我跟踪的所有页面上我都会收到重复查询的报告如下所示但是我在 SQL Server Profiler 中跟踪了查询毫无疑问它只访问数据库一次我在这里错过了一
Admob - 横幅显示黑色背景且无广告

我在用着离子框架 http ionicframework com 以及这个插件 https github com floatinghotpot cordova plugin admob https github com floatingho
使用 Ordnance Survey/Openlayers api 拖动标记

我创建了一个网站使用 Ordnance Survey 我认为这称为 OpenSpace 生成的基于 OpenLayers 的 api 我已经有了它因此您可以单击地图来添加标记然后我希望能够单击标记并将其拖动到地图周围有没有一种简单的方
有没有办法通过 EntityKey 删除实体而不加载它？

有没有办法通过 EntityKey 删除实体而不加载它 Tamir 的链接有效但它使用了实体框架团队不再推荐的方法查看this tip http blogs msdn com alexj archive 2009 03 27 tip 9
Android 分页库不会触发 loadAfter()

我正在使用新的 Android Paging 库来获取具有无限滚动功能的 RecyclerView 我无法理解为什么当我像这样设置 PagedList 时库不触发 loadAfter 方法 val config PagedList Conf
尝试运行 Grails 应用程序时出错

我是 Grails 新手我使用 GVM 工具安装了它并且尝试从终端运行默认应用程序只需尝试以下命令 grails create app demo 然后 grails run app 我得到了巨大错误 Running Grails ap
将文件列表过滤为存在的文件

如何将文件列表过滤为存在的文件例如 echo a txt does not exist b txt
可观察到的混乱

我在用Ionic2 with AngularFire2 我也在利用rxjs Observable 我有以下代码 findChatsForUid uid string Observable
动态地将 BoxView 添加到网格 [Xamarin.Forms]

我正在尝试使用 3 列和多行以网格格式添加 BoxView 我已经使用 xaml 和行为定义了网格在 c 文件中应该发生的是应该为相同数量的图像创建 BoxView 每列 3 个图像 Thanks XAML
如果禁用第 3 方 cookie，facebook javascript/php SDK 可以相互“对话”吗？ facebook->getUser() 返回 0

我正在构建一个与 facebook javascript php SDK 一起工作的网站它通常运行良好但是我发现对于一台使用 chrome 的测试机当我从客户端 javascript 端执行 FB 登录时 PHP sdk后端无法识别
Google 表格脚本错误“无法访问服务：镜像”

我在 Google Sheets 中有一个脚本实际上我无法执行任何操作例如 function onOpen e var ui SpreadsheetApp getUi Or SpreadsheetApp or FormApp ui cr
从封闭泛型中提取泛型类型

我想要这样的东西 class Foo
DOM VBA IE11 自动在网站上下订单 - OnChange 和图片上传出现问题

我们有一个虚拟助手在此网站上下了数百个球标订单 https www golfballs com Golf Misc Tools Classic Photo Poker Chips 3 Pack htm https www golfballs
如何访问所有 URL 的 Selenium Python

我试图访问所有显示的网址但它首先访问而不是所有谷歌搜索网址 browser get https www google co uk search q Rashmi oq Rashmi aqs chrome 69i57j69i60l3 68

如何访问所有 URL 的 Selenium Python

如何访问所有 URL 的 Selenium Python 的相关文章

随机推荐

热门标签