selenium学习指南

2023-10-27

Selenium 是一套 Web网站的程序自动化操作解决方案。通过它，我们可以写出自动化程序，像人一样在浏览器里操作web界面。比如点击界面按钮，在文本框中输入文字等操作。而且还能从web界面获取信息。比如获取火车、汽车票务信息、招聘网站职位信息，财经网站股票价格信息等等，然后用程序进行分析处理。

写的自动化程序需要使用 客户端库。我们程序的自动化请求都是通过这个库里面的编程接口发送给浏览器。比如，我们要模拟用户点击界面按钮，自动化程序里面就应该调用客户端库相应的函数，就会发送 点击元素 的请求给下方的 浏览器驱动。然后，浏览器驱动再转发这个请求给浏览器。这个自动化程序发送给浏览器驱动的请求是HTTP请求。

客户端库从哪里来的？是Selenium组织提供的。Selenium组织提供了多种编程语言的Selenium客户端库，包括 java，python，js， ruby等，方便不同编程语言的开发者使用。我们只需要安装好客户端库，调用这些库，就可以发出自动化请求给浏览器。

总结一下，selenium 自动化流程如下：

自动化程序调用Selenium 客户端库函数（比如点击按钮元素）
客户端库会发送Selenium 命令给浏览器的驱动程序
浏览器驱动程序接收到命令后 ,驱动浏览器去执行命令
浏览器执行命令
浏览器驱动程序获取命令执行的结果，返回给我们自动化程序
自动化程序对返回结果进行处理

选择元素的方法（控制界面元素）：

主要流程：选择界面元素（定位界面元素），操作定位到的元素。

选择定位元素的方法：

1、id属性，选择元素。

element = driver.find_element_by_id('kw').send_keys('通讯\n')

2、class属性，选择元素。

elements = driver.find_elements_by_class_name('animal')
for element in elements:
    print(element.text)

3、Tag名称，选择元素

# 根据 tag name 选择元素，返回的是一个列表
# 里面 都是 tag 名为 div 的元素对应的 WebElement对象
elements = wd.find_elements(By.TAG_NAME, 'div')
# 取出列表中的每个 WebElement对象，打印出其text属性的值
# text属性就是该 WebElement对象对应的元素在网页中的文本内容
for element in elements:
    print(element.text)

driver.find_element(By.LINK_TEXT,'新房')，一般用在a标签，link_text定位的是超链接的全部文本内容，所以匹配条件为绝对匹配。
driver.find_element(By.PARTIAL_LINK_TEXT,''),partial_link_text为link_text的补充，partial_link_text定位的是超链接的局部文本内容，所以匹配条件为部分匹配就满足条件
driver.find_element(By.XPATH,''),路径定位，xpath定位(全路径、根据属性值定位、逻辑和属性值定位、标签类型和属性值定位)

4、等待界面元素出现

进行网页操作的时候，有的元素内容不是可以立即出现的，可能会等待一段时间。因为我们的代码执行的速度比网站相应的速度要快。在短暂的瞬间，网页上是没有用 id为1的元素的，还没有搜索结果，自然就会报告错误 id为1 的元素不存在了。点击搜索后，可以用sleep 来等待几秒钟，等服务器返回结果后，再去选择 id的元素。

Selenium提供了一个更合理的解决方案，当发现元素没有找到的时候，并不立即返回找不到元素的错误。而是周期性（每隔半秒钟）重新寻找该元素，直到该元素找到，或者超出指定最大等待时长，这时才抛出异常。Selenium 的 Webdriver 对象有个方法叫 implicitly_wait ，可以称之为 隐式等待 ，或者 全局等待 。

显式等待：

设置一个超时时间，每个一段时间就去检测一次该元素是否存在，如果存在则执行后续内容，如果超过最大时间（超时时间）则抛出超时异常。

隐式等待：

隐式等待也是指定一个超时时间，如果超出这个时间指定元素还没有被加载出来,会抛出异常。隐式等待是全局性的，即运行过程中，如果元素可以定位到，它不会影响代码运行，但如果定位不到，则它会以轮询的方式不断地访问元素直到元素被找到，若超过指定时间，则抛出异常。使用implicitly_wait实现隐式等待。driver.implicitly_wait(5)

强制等待：

使用 time.sleep() 强制等待，设置固定的休眠时间，对于代码的运行效率会有影响。

5、浏览器的控制及常见操作

# 设置浏览器浏览器的宽高为：600x800
driver.set_window_size(600, 800)

#设置实现浏览器全屏显示
driver.maximize_window()

#返回（后退）到页面
driver.back()

#前进页面
driver.forward()

#新标签中打开
js = "window.open('https://blog.csdn.net/qq_43965708')"
driver.execute_script(js)

# 刷新页面
driver.refresh()

# 获取打开的多个窗口句柄
windows = driver.window_handles
# 切换到当前最新打开的窗口
driver.switch_to.window(windows[-1])

#模拟输入指定内容
send_keys()

#清除文本内容
clear() 

#判断元素是否可见
is_displayed()

#获取标签属性值
get_attribute()

#返回元素的尺寸
size

#返回元素文本
text 

# 点击左键
click()

# 点击右键
context_click()

# 双击
double_click()

# 模拟回车键进行跳转（输入内容后） 
driver.find_element_by_id('xxx').send_keys(Keys.ENTER)

# 使用 Backspace 来删除一个字符
driver.find_element_by_id('xxx').send_keys(Keys.BACK_SPACE)

# Ctrl + A 全选输入框中内容
driver.find_element_by_id('xxx').send_keys(Keys.CONTROL, 'a')

# Ctrl + C 复制输入框中内容
driver.find_element_by_id('xxx').send_keys(Keys.CONTROL, 'c')

# Ctrl + V 粘贴输入框中内容
driver.find_element_by_id('xxx').send_keys(Keys.CONTROL, 'v')

#关闭所有窗口
driver.quit()

#关闭当前页面
driver.close()

弹窗处理：

有三种弹窗alter（确认）、confirm（确认、取消）、prompt（文本框、确认、取消)。

处理方式：先定位（switch_to.alter,自动获取当前弹窗），在使用text、accept、dismiss、send_keys等方法进行操作。

#获取弹窗中的文字
text

#接受（确认）弹窗内容
accept

#解除（取消）弹窗
dismiss

#发送文本至警告框
send_keys

selenium消除启动特征避免被反爬 , selenium启动的Chrome中有几十个特征可以被识别，常见的配置如下：

设置请求头的user-agent
chrome_options.add_argument('user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36')
设置正常浏览器
chrome_options.add_experimental_option("excludeSwitches", ["enable-automation"])
设置为无头模式
chrome_options.add_argument('--headless')
谷歌浏览器高版本强化隐藏，防止发现
chrome_options.add_argument("--disable-blink-features=AutomationControlled")
取消浏览器顶部的自动软件控制，屏蔽webdriver特征
chrome_options.add_experimental_option("excludeSwitches", ["enable-automation"])
chrome_options.add_experimental_option('useAutomationExtension', False)

常见的报错原因：

1.NoSuchElementException：没有找到元素

2.NoSuchFrameException：没有找到iframe

3.NoSuchWindowException:没找到窗口句柄handle

4.NoSuchAttributeException:属性错误

5.NoAlertPresentException：没找到alert弹出框

6.lementNotVisibleException：元素不可见

7.ElementNotSelectableException：元素没有被选中

8.TimeoutException：查找元素超时

normalize-space(//div[contains(text(),'装修情况')]/following-sibling::div[1])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

selenium学习指南的相关文章

如何在flask中使用g.user全局

据我了解 Flask 中的 g 变量它应该为我提供一个全局位置来存储数据例如登录后保存当前用户它是否正确我希望我的导航在登录后在整个网站上显示我的用户名我的观点包含 from Flask import g among other
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
如何使用 Java 和 Selenium WebDriver 在 C 目录中创建文件夹并需要将屏幕截图保存在该目录中？

目前正在与硒网络驱动程序和代码Java 我有一种情况我需要在 C 目录中创建一个文件夹并在该文件夹中创建我通过 selenium Web 驱动程序代码拍摄的屏幕截图它需要存储在带有时间戳的文件夹中如果我每天按计划运行脚本所有屏幕截
PyUSB 1.0：NotImplementedError：此平台不支持或未实现操作

我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位并从以下地址下载 z
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
SQLALchemy .query：类“Car”的未解析属性引用“query”

我有一个这里已经提到的问题https youtrack jetbrains com issue PY 44557 https youtrack jetbrains com issue PY 44557 但我还没有找到解决方案我使用 Pyt
Python pickle：腌制对象不等于源对象

我认为这是预期的行为但想检查一下也许找出原因因为我所做的研究结果是空白我有一个函数可以提取数据创建自定义类的新实例然后将其附加到列表中该类仅包含变量然后我使用协议 2 作为二进制文件将该列表腌制到文件中稍后我重新运行脚本
如何使用 OpencV 从 Firebase 读取图像？

有没有使用 OpenCV 从 Firebase 读取图像的想法或者我必须先下载图片然后从本地文件夹执行 cv imread 功能有什么办法我可以使用cv imread link of picture from firebase 您可以
AWS EMR Spark Python 日志记录

我正在 AWS EMR 上运行一个非常简单的 Spark 作业但似乎无法从我的脚本中获取任何日志输出我尝试过打印到 stderr from pyspark import SparkContext import sys if name m
从 Flask 访问 Heroku 变量

我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
IO 密集型任务中的 Python 多线程

建议仅在 IO 密集型任务中使用 Python 多线程因为 Python 有一个全局解释器锁 GIL 只允许一个线程持有 Python 解释器的控制权然而多线程对于 IO 密集型操作有意义吗 https stackoverflow c
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
Jupyter Notebook 内核一直很忙

我已经安装了 anaconda 并且 python 在 Spyder IPython 等中工作正常但是我无法运行 python 笔记本内核被创建它也连接但它始终显示黑圈忙碌符号防火墙或防病毒软件没有问题我尝试过禁用两者我也无法
将图像分割成多个网格

我使用下面的代码将图像分割成网格的 20 个相等的部分 import cv2 im cv2 imread apple jpg im cv2 resize im 1000 500 imgwidth im shape 0 imgheight i
向 Altair 图表添加背景实心填充

I like Altair a lot for making graphs in Python As a tribute I wanted to regenerate the Economist graph s in Mistakes we
每个 X 具有多个 Y 值的 Python 散点图

我正在尝试使用 Python 创建一个散点图其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值如果每个 X 值的 Y 值的数量相同我可以使用以下代码使其工作 import numpy as np import mat
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
如何为基于 Polymer (JS) 的应用程序编写端到端测试（大约 2015 年 5 月）？

我已经构建了一个基于聚合物的应用程序我想为其编写一些端到端测试不是单元测试而是用户行为集成测试目前 2015 年 5 月我该如何执行此操作这几天我一直在研究这个问题尽管网络上有大量专门讨论一个或另一个相关主题的页面但没有任何
如何使用 Pycharm 安装 tkinter？ [复制]

这个问题在这里已经有答案了 I used sudo apt get install python3 6 tk而且效果很好如果我在终端中打开 python Tkinter 就可以工作但我无法将其安装在我的 Pycharm 项目上 pip
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2

随机推荐

element-ui走马灯实现图片自适应

elementUI走马灯实现图片自适应等比缩放使得图片缩小不挤压放大不拉伸变形解决方法的原理监听屏幕视口大小如果 resize 发生改变了就获取图片的高度height 然后渲染到页面 ElementUI 地址 https ele
arch/arm/boot/dts/imx50.dtsi:16:42: fatal error: dt-bindings/clock/imx5-clock.h: 没有那个文件或目录

编译设备树出错 arch arm boot dts omap2 dtsi 11 35 fatal error dt bindings gpio gpio h No such file or directory 或者 arch arm boo
Ragnar Locker勒索软件团伙在Facebook上刊登Campari黑客的广告

Ragnar Locker勒索软件运营商已经开始在Facebook上利用广告迫使受害者支付赎金在2019年11月勒索软件运营商已开始采用一种新的双重勒索策略该策略首先由迷宫团伙 Maze gang 使用即在加密受感染的系统之前威胁
jsp里怎么获取input里的值在function里用

第一种通过getElementById找到input节点然后获取value属性 1 定义一个input节点
使用 CloudFlare 免费 CDN 加速 WordPress

具体使用参考文章 CloudFlare 免费 CDN 加速使用方法你似乎来到了没有知识存在的荒原知乎 CloudFlare 免费 CDN 优化指南 CloudFlare免费CDN优化指南知乎 CloudFlare 加速 WordPre
Wireshark 抓包工具使用记录

1 搜索 Wireshark 安装注意要中途要安装 pcap 否则会提示找不到网络安装过程全部默认选项 2 抓取移动端软件接口包在安装了Winpcap 的电脑上分一个wifi 360wifi等等用手机连接这个wifi 然后启动
Docker部署单点Elasticsearch与Kibana

一创建网络因为需要部署kibana容器因此需要让es和kibana容器互联这里创建一个网络 docker network create es net 创建一个网络名称为 es net 二拉取并加载镜像方式一 docker pul
台词生成器 (html5 版)

最近经常看到别人 PS 来恶搞泰囧电影中的台词觉得挺好玩的先上效果图就想用 html5 自己也做一个来玩玩查了下 API 发现还是挺简单的 context fillText text x y width 参数 text 要生成的
Eclipse快捷键大全

快捷键 Eclipse中有如下一些和编辑相关的快捷键 1 ALT 此快捷键为用户编辑的好帮手能为用户提供内容的辅助不要为记不全方法和属性名称犯愁当记不全类方法和属性的名字时多体验一下 ALT 快捷键带来的好处吧 2 Ctrl O
Spring Boot之 Controller 接收参数和返回数据总结(包括上传、下载文件)

转载自 https blog csdn net jy02268879 article details 82830789 一接收参数 postman发送 1 form表单 RequestParam name String name 会把传递
React入门教程之井字棋(四)——时间旅行

接下来是最后一个练习我们将实现回到过去的功能从而在游戏里跳回到历史步骤保存历史记录如果我们直接修改了 square 数组实现时间旅行就会变得很棘手了不过我们可以使用 slice 函数为每一步创建 squares 数组的副本
Memcached的安装与基础语法

Memcached Memcached 简介 Memcached是一个自由开源的高性能分布式内存对象缓存系统 Memcached简洁而强大它的简洁设计便于快速开发减轻开发难度解决了大数据量缓存的很多问题它的API兼容大部分流行的
JS校验数值

JS校验数值的范围大小及长度 function isInt str maxlen min max var pattern 0 1 9 d 非负整数正整数 0 if str null str if pattern test str fal
链接的请求方式是get

超链接的请求是get Get 是以实体的方式得到由请求URI所指定资源的信息如果请求URI只是一个数据产生过程那么最终要在响应实体中返回的是处理过程的结果所指向的资源而不是处理过程的描述
win10下对编译完成后opencv_cuda进行移植

系列文章目录 win10下Opencv源码编译支持CUDA加速的Python环境超级详细教程 win10下对编译完成后opencv cuda进行移植文章目录系列文章目录一 opencv python环境配置二 opencv pyt
01、虚拟机（VMware ）部署

一 VMware 概述 VMware是一家提供虚拟化解决方案的领先公司其产品被广泛应用于企业和个人用户的计算环境中 VMware的虚拟化技术可以将物理计算资源如服务器存储和网络抽象成虚拟化的资源从而提供更高的灵活性可扩展性和资源
Hbase Coprocessor 协处理器与 JavaAPI

协处理器概念一协处理器有两种 observer 和 endpoint 1 observer协处理器 Observer 类似于传统数据库中的触发器当发生某些事件的时候这类协处理器会被 Server 端调用 Observer Coproc
2021-08-26

安装opencv python库安装opencv python库安装opencv python库 curl https bootstrap pypa io pip 2 7 get pip py o get pip py python g
升级 Node 版本教程

文章目录 Window 系统 Mac 或 Linux系统 Window 系统 window系统升级node只能到node官网下载window安装包来覆盖之前的node node 安装教程附下载地址 https blog csdn net q
selenium学习指南

Selenium 是一套 Web网站的程序自动化操作解决方案通过它我们可以写出自动化程序像人一样在浏览器里操作web界面比如点击界面按钮在文本框中输入文字等操作而且还能从web界面获取信息比如获取火车汽车票务信息招聘

selenium学习指南

selenium学习指南 的相关文章

随机推荐

热门标签

selenium学习指南的相关文章