使用 python selenium 和 Firefox 或 Chrome headless 截取整个页面的屏幕截图

2023-11-26

这篇文章与此相关：

Python selenium 屏幕截图无法获取整个页面

PhantomsJS 的解决方案似乎有效：

driver = webdriver.PhantomJS()    
driver.maximize_window()
driver.get('http://www.angelfire.com/super/badwebs/')  
scheight = .1
while scheight < 9.9:
    driver.execute_script("window.scrollTo(0, document.body.scrollHeight/%s);" % scheight)
    scheight += .01        
driver.save_screenshot('angelfire_phantomjs.png')

然而，该解决方案是从 2014 年开始的，PhantomJS 同时已被弃用。我收到以下错误消息：

...
UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox instead
warnings.warn('Selenium support for PhantomJS has been deprecated, please use headless '

如果我尝试适应例如Firefox 无头版是这样的：

from selenium import webdriver

firefox_options = webdriver.FirefoxOptions()
firefox_options.set_headless() 
firefox_driver = webdriver.Firefox(firefox_options=firefox_options)

firefox_driver.get('http://www.angelfire.com/super/badwebs/')  
scheight = .1
while scheight < 9.9:
    firefox_driver.execute_script("window.scrollTo(0, document.body.scrollHeight/%s);" % scheight)
    scheight += .01        
firefox_driver.save_screenshot('angelfire_firefox.png')

制作了屏幕截图，但不是整个页面。

有什么想法可以让它与 Firefox 或 Chrome headless 一起使用吗？

（P.S.我还发现了这篇文章：

使用 Selenium Python (chromedriver) 截取整页屏幕截图)

但这似乎不是一个通用的解决方案，而且要复杂得多。）

这是我想出的方法，可以完美地截取任意长度的网站屏幕截图。它利用了无头浏览器可以在运行前将窗口设置为任意大小的事实，挑战是在运行无头浏览器之前获取滚动高度。这是唯一的缺点，需要运行该网站两次。

from selenium import webdriver
from PIL import Image
from selenium.webdriver.chrome.options import Options
import time

url = 'any website url'

#run first time to get scrollHeight
driver = webdriver.Chrome()
driver.get(url)
#pause 3 second to let page load
time.sleep(3)
#get scroll Height
height = driver.execute_script("return Math.max( document.body.scrollHeight, document.body.offsetHeight, document.documentElement.clientHeight, document.documentElement.scrollHeight, document.documentElement.offsetHeight )")
print(height)
#close browser
driver.close()

#Open another headless browser with height extracted above
chrome_options = Options()
chrome_options.add_argument("--headless")
chrome_options.add_argument(f"--window-size=1920,{height}")
chrome_options.add_argument("--hide-scrollbars")
driver = webdriver.Chrome(options=chrome_options)

driver.get(url)
#pause 3 second to let page loads
time.sleep(3)
#save screenshot
driver.save_screenshot('screen_shot.png')
driver.close()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Googlechrome

selenium

firefox

使用 python selenium 和 Firefox 或 Chrome headless 截取整个页面的屏幕截图的相关文章

计算另一个字符串中多个字符串的出现次数

在 Python 2 7 中给定以下字符串 Spot是一只棕色的狗斑点有棕色的头发斑点的头发是棕色的查找字符串中 Spot brown 和 hair 总数的最佳方法是什么在示例中它将返回 8 我正在寻找类似的东西string c
在 Python 中将列表元素作为单独的项目返回

Stackoverflow 的朋友们大家好我有一个计算列表的函数我想单独返回列表的每个元素如下所示接收此返回的函数旨在处理未定义数量的参数 def foo my list 1 2 3 4 return 1 2 3 4 列表中的元素数
在 Celery 任务中调用 Google Cloud API 永远不会返回

我正在尝试拨打外部电话Google Cloud Natural Language API从一个内Celery任务使用google cloud python包裹问题是对 API 的调用永远不会返回挂起 celery task def g
VSCode Settings.json 丢失

我正在遵循教程并尝试将 vscode 指向我为 Scrapy 设置的虚拟工作区但是当我在 VSCode 中打开设置时工作区设置选项卡不在用户设置选项卡旁边我还尝试通过以下方式手动转到文件 APPDATA Code User s
在 Django Admin 中调整字段大小

在管理上添加或编辑条目时 Django 倾向于填充水平空间但在某些情况下当编辑 8 个字符宽的日期字段或 6 或 8 个字符的 CharField 时这确实是一种空间浪费字符宽然后编辑框最多可容纳 15 或 20 个字符我如何告
Tensorboard SyntaxError：语法无效

当我尝试制作张量板时出现语法错误尽管开源代码我还是无法理解我尝试搜索张量板的代码但不清楚即使我不擅长Python 我这样写路径C Users jh902 Documents logs因为我正在使用 Windows 10 但我不确定
打印数字时添加千位分隔符[重复]

这个问题在这里已经有答案了我真的不知道这个问题的名称所以它可能是一个不正确的标题但问题很简单如果我有一个数字例如 number 23543 second 68471243 我想要它使print 像这样 23 54368 471
矩形函数的数值傅里叶变换

本文的目的是通过一个众所周知的分析傅里叶变换示例来正确理解 Python 或 Matlab 上的数值傅里叶变换为此我选择矩形函数这里报告了它的解析表达式及其傅立叶变换https en wikipedia org wiki Rectan
如何使用 Selenium 和 ChromeDriver 解决 TypeError: 'module' object is not callable 错误 [重复]

这个问题在这里已经有答案了代码试验 from selenium import webdriver from selenium webdriver chrome options import Options as Chromeoptions
使用 Python Oauthlib 通过服务帐户验证 Google API

我不想使用适用于 Python 的 Google API 客户端库但仍想使用 Python 访问 Google APIOauthlib https github com idan oauthlib 创建服务帐户后谷歌开发者控制台 http
未知错误：Chrome 无法启动：异常退出

当我使用 chromedriver 对 Selenium 运行测试时出现此错误 selenium common exceptions WebDriverException Message unknown error Chrome fail
如何使用 Python 3 检查目录是否包含文件

我到处寻找这个答案但找不到我正在尝试编写一个脚本来搜索特定的子文件夹然后检查它是否包含任何文件如果包含则写出该文件夹的路径我已经弄清楚了子文件夹搜索部分但检查文件却难倒了我我发现了有关如何检查文件夹是否为空的多个建议并且我尝
后台脚本 chrome.tabs 在 chrome 扩展中未定义？

我试过这个背景 js chrome browserAction onClicked addListener function activeTab chrome tabs query active true currentWindow tr
为什么 csv.DictReader 给我一个无属性错误？

我的 CSV 文件是 200 Service 我放入解释器的代码是 snav csv DictReader open screennavigation csv delimiter print snav fieldnames 200 for
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
制作一份 Python 文档的 PDF 文件

Python 官方网站提供 PDF 文档下载但它们是按章节分隔的我下载了源代码并构建了 PDF 文档这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件我认为这样阅读起来会更方便如果连接单独
Firebase Firestore：获取文档的生成 ID (Python)

我可以创建一个新文档带有自动生成的 ID 并存储对其的引用如下所示 my data key value doc ref db collection u campaigns add my data 我可以像这样访问数据本身 print d
等待子进程使用 os.system

我用了很多os system在 for 循环内调用创建后台进程如何等待所有后台进程结束 os wait告诉我没有子进程 ps 我使用的是Solaris 这是我的代码 usr bin python import subprocess imp
如何使用 PrimaryKeyRelatedField 更新多对多关系上的类别

Django Rest 框架有一个主键相关字段 http www django rest framework org api guide relations primarykeyrelatedfield其中列出了我的 IDmany to m
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并

随机推荐

如何在 Elm 中提交表单？

这是一个非常基本的问题但我没有找到任何例子我有这样的看法 view address model div div text lt ID toString model id form input value model title text
SES AWS 错误代码：SignatureDoesNotMatch，状态代码：403

我在尝试通过 Amazon SES 发送邮件时收到 AWS 错误代码 SignatureDoesNotMatch 状态代码 403 我已确认我使用的是通过以下方式创建的正确凭据https console aws amazon com iam
检查 GET 中是否传递了任何变量

我已经做了一些搜索但没有得出任何结果我确信这是显而易见的基本上我试图弄清楚是否有任何内容通过 GET 从表单传递我知道如何检查单个元素但我只想快速检查是否有任何内容通过 Cheers 使用时要小心count GET 如果您提交包
如何在ActionBar的导航选项卡中设置自定义View并使选项卡适应其高度？

我正在使用ActionBar我想设置一个自定义View在导航选项卡中选项卡的高度似乎是固定的我的自定义View较大所以不适合我尝试自定义样式如下所示但它并没有使选项卡更高如何让选项卡的高度适应我的自定义View size 我知
压缩 xml 文件的 Subversion diff

我正在使用 MySQL Workbench 来维护应用程序的数据库架构这 mwbWorkbench 使用的文件是一个压缩的 XML 文档保存在 Subversion 存储库中该文件被 Subversion 视为二进制数据因此我无法使
有没有办法跟踪批处理文件的执行情况？

我继承了一些大型批处理文件我想将它们重写为更开发人员友好的语言我想了解以下几点它调用了什么其他脚本它启动了哪些其他进程它写入哪些文件它使用哪些环境变量设置哪些环境变量对于最后一点我知道在开始之前我可以这样做 set g
Opengls eglCreateWindowSurface GL 错误 EGL_BAD_ALLOC

我正进入状态eglCreateWindowSurface GL Error EGL BAD ALLOC在三星 Galaxy S6 中安装后首次打开应用程序时相同的代码在其他设备中运行良好我尝试清理内存并销毁纹理并在销毁时取消初始化所有
无法在 64 位 Linux 上构建 32 位 Wine

我正在尝试这样做使用 automake 配置脚本在 64 位 Linux 上构建 32 位对我不起作用编译酒我在 config log 中找到了这个 configure failed program was confdefs h d
使用 Python 处理 MySQL 未读结果

我使用 mysql connector 进行 SQL 操作我有一个简短的脚本它在光标上执行以下操作字符串 cursor execute use format db show tables command ALTER TABLE Obj
使用 Array.CreateInstance 和 new 运算符实例化数组的区别

我可以看到以下两种在 C 中实例化 int 数组的方法通过 API系统数组抽象类 var arrayInstance Array CreateInstance typeof int 4 通过各种数组初始化语法 var arrayInst
PHP 中的自动图像格式检测

我正在寻找一种方法来获取当前放置在临时位置的用户上传的图像例如 tmp jkhjkh78 并从中创建 php 图像自动检测格式有没有比一堆尝试捕获 jpeg 图像 png 图像等更聪明的方法来做到这一点这是的功能之一获取图像大小
iPhone 上的内嵌 html5 视频

我想在 iPhone 上播放 HTML5 视频但每当我尝试播放时当调用视频 play 时 iPhone 都会自动弹出全屏如何在 iPhone 不改变 UI 的情况下内嵌播放视频如下所示 http www easy bits com
使用 kubernetes 执行器时 Airflow-dag_id 无法找到问题

我正在使用气流稳定的 Helm Chart 并使用 Kubernetes Executor 正在为 dag 安排新的 pod 但它因 dag id 无法找到问题而失败我正在使用 git sync 来获取 dags 以下是错误和 kuber
UITableViewCell 圆角和剪辑子视图

我在任何地方搜索引擎文档此处等都找不到任何内容来显示如何在也剪辑子视图的元素上创建圆角尤其是在分组表视图中我有代码可以正确地从具有 4 个弧圆角的路径创建一个圆角矩形该代码已在我的子类 uitableviewcell 中的
在 PHP 中处理格式错误的 JSON

我正在尝试编写一个 php 脚本来处理来自以字符串形式提供 json 的 Web 服务的数据问题是字符串并不是真正的 json 这是 JavaScript 具体来说尽管变量被引用但键未被引用示例实际数据更长且更复杂 desc Us
无法读取 CFPrefsPlistSource iOS 10 中的值

我今天已将 Xcode 8 更新到 beta 2 并尝试在 App 和 Today Extension 之间共享数据我面临着这个日志警告 2016 07 08 18 00 24 732472 ProjetctX 941 42801 用户默
Junit：为删除实体的方法编写测试？

最会是什么详尽的我可以为以下代码编写测试吗 public void deleteFromPerson person person person personRepository returnPerson person getId perso
如何将字节数组转换为字符串，反之亦然？

我必须在 Android 中将字节数组转换为字符串但我的字节数组包含负值如果我再次将该字符串转换为字节数组我得到的值将与原始字节数组值不同我该怎么做才能获得正确的转换我用来进行转换的代码如下 Code to convert byt
在 Grafana 仪表板中嵌入网站

我运行 Grafana 7 2 0 开源版需要将网站嵌入仪表板本身也就是说我需要一排或两排常用的图表面板并在它们下面嵌入一个需要定期重新加载的外部网站我怎样才能实现这个目标貌似没有相关插件https grafana com gr
使用 python selenium 和 Firefox 或 Chrome headless 截取整个页面的屏幕截图

这篇文章与此相关 Python selenium 屏幕截图无法获取整个页面 PhantomsJS 的解决方案似乎有效 driver webdriver PhantomJS driver maximize window driver get

使用 python selenium 和 Firefox 或 Chrome headless 截取整个页面的屏幕截图

使用 python selenium 和 Firefox 或 Chrome headless 截取整个页面的屏幕截图 的相关文章

随机推荐

热门标签

使用 python selenium 和 Firefox 或 Chrome headless 截取整个页面的屏幕截图的相关文章