如何在 Ruby 中使用 selenium-webdriver/capybara 截取完整浏览器页面及其元素的屏幕截图？

2024-03-09

我正在研究屏幕截图自动化。特别是，我正在努力实现以下目标：

提示用户提供网站不同页面的链接 X
提示用户输入类名 Y
我应该能够访问网站 X 登录页面，提供登录详细信息（假设它们已知），单击“提交”按钮，这应该将我重定向到“主页”页面
然后，我查看用户提供的链接列表，访问每个页面并截取具有 Y 类（或整个页面）的所有元素的屏幕截图
将它们保存在当前目录中

请点击链接查看视觉表现 https://i.stack.imgur.com/qLE40.png

我想在 Ruby 中实现以下解决方案（但我也愿意接受任何其他建议）：

1) 截取网站 X 上整个可滚动页面的屏幕截图 2) 找到 Y 类的元素，特别是它在页面上的位置、宽度和高度。 3）裁剪完整屏幕截图，以便只显示所需的元素

问题如下：

我无法截取整个页面的屏幕截图，我只能截取屏幕可见区域的屏幕截图。

这是我尝试过的以及相应的问题：

解决方案 1（Ruby - 常规）：

require 'selenium-webdriver'

driver = Selenium::WebDriver.for :firefox #:chrome

driver.navigate.to "https://some_very-very_long_page_on_website_X"
driver.manage.window.maximize # <- works for firefox only
driver.save_screenshot('picture1.png')

# Problem: it captures only the viewable area, 
# not an entire page

解决方案 2（Ruby - 调整窗口大小）：

require 'selenium-webdriver'

driver = Selenium::WebDriver.for :firefox #:chrome
driver.navigate.to 'https://some_very-very_long_page_on_website_X'

width  = driver.execute_script("return Math.max(document.body.scrollWidth,document.body.offsetWidth,document.documentElement.clientWidth,document.documentElement.scrollWidth,document.documentElement.offsetWidth);")
height = driver.execute_script("return Math.max(document.body.scrollHeight,document.body.offsetHeight,document.documentElement.clientHeight,document.documentElement.scrollHeight,document.documentElement.offsetHeight);")

driver.manage.window.resize_to(width, height) # <- resizes the window
driver.manage.window.full_screen  # <- works, but in chrome throws:
                                  # full_screen': undefined method `full_screen_window'

picture = driver.screenshot_as(:png)

File.open('picture2.png', 'w+') do |fh|
  fh.write picture
end

driver.quit

# Resizes the window only to the viewable area, as a result,
# it captures the viewable area only

解决方案 3（红宝石 - watir gem）：

require 'watir'

b = Watir::Browser.new
b.goto 'https://some_very-very_long_page_on_website_X'
b.screenshot.save("picture.png")

# Issues: does not capture the entire page

解决方案 4（Ruby - 单元素捕获）

require "selenium-webdriver"

driver = Selenium::WebDriver.for :chrome

driver.get'https://some_very-very_long_page_on_website_X'

driver.manage.window.maximize
driver.execute_script("document.getElementById('some_id').scrollIntoView();")
driver.save_screenshot "picture3.png"

# Problem: captures the element, which I need, but only if its size is less than
# the viewable area

解决方案 5（Ruby - 缩放）

require "selenium-webdriver"

driver = Selenium::WebDriver.for :firefox

driver.get 'https://some_very-very_long_page_on_website_X'

driver.manage.window.maximize
driver.execute_script("document.body.style.transform = 'scale(0.5)'")
#driver.execute_script("document.body.style.zoom = '50%'") <-- transform works better than zoom

driver.save_screenshot "picture3.png"

#Issues: works, but not for very long pages, in addition it may change the layout
# (some elements may start to overlap each other)
# Also I am not sure how to calculate the value of the parameter for scale
# for very long pages

解决方案 6 -（Ruby - 无头 Chrome 调整大小）

require "selenium-webdriver"

options = Selenium::WebDriver::Chrome::Options.new
options.add_argument('--headless')
driver = Selenium::WebDriver.for :chrome, options: options

driver.get "https://some_very-very_long_page_on_website_X"

width  = driver.execute_script("return Math.max(document.body.scrollWidth,document.body.offsetWidth,document.documentElement.clientWidth,document.documentElement.scrollWidth,document.documentElement.offsetWidth);")
height = driver.execute_script("return Math.max(document.body.scrollHeight,document.body.offsetHeight,document.documentElement.clientHeight,document.documentElement.scrollHeight,document.documentElement.offsetHeight);")

driver.manage.window.resize_to(width+2000, height+2000) # <-- if I do not have +2000, page looks squished
                                                        # the greater the number, the greater the quality
                                                        # but also the more white space is around the page
                                                        # and the picture is heavier
driver.manage.window.maximize

sleep 5             # <--- required waiting for page loading 
driver.save_screenshot "full.png"

# One of the best approaches, but it is not clear to me how to calculate 
# the parameters for resize_to

工具/技术：

硒-webdriver (3.12.0)
Chrome 驱动程序 2.40

您可以使用 Firefox 和"webdrivers" https://github.com/titusfortner/webdriversgem，它安装"selenium-webdriver"作为依赖项：

require "webdrivers/geckodriver"

driver = Selenium::WebDriver.for :firefox
driver.get("https://openai.com/api/")
File.binwrite("screenshot.png", driver.screenshot_as(:png, full_page: true))
driver.quit

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

javascript

ruby

seleniumwebdriver

capybara

screenshot

如何在 Ruby 中使用 selenium-webdriver/capybara 截取完整浏览器页面及其元素的屏幕截图？的相关文章

使用复选框过滤列表

我有一个电影列表及其评级在我的页面顶部我有一个表单其中提供了一个复选框列表其中显示了每个可用的评级 G PG 13 等一旦用户单击复选框并点击提交我只想显示所选的电影在我的索引方法中我有一个名为的实例变量 filtered
在 Internet Explorer 中使用什么来监视 jscript 内存使用情况

我们正在调试 GWT 应用程序在 Firefox 中运行正常在 IE6 0 中开始运行正常但一段时间后它就会崩溃并开始爬行经过一些测试后我们怀疑存在一些内存问题使用了太多内存内存泄漏等除了使用taskmanager和pro
从函数返回函数的目的是什么？

阅读一些遗留代码发现 A prototype setSize function var v1 new Vector2 return function size var halfSize v1 copy size multiplyScala
nodejs (libuv) 事件循环是否在一个阶段（队列）中执行所有回调，然后再进入下一阶段或以循环方式运行？

我正在研究 Node js 中 libuv 提供的事件循环我遇到了关注 Deepal Jayasekara 的博客 https blog insiderattack net event loop and the big picture n
如何使用javascript确保元素仅在圆上朝一个方向移动？

好吧我承认我对三角学真的很糟糕出于上下文的考虑我将添加我在这里提到的问题中的内容参考问题 https stackoverflow com a 39429290 168492 https stackoverflow com a 394
导航栏下拉菜单（折叠）在 Bootstrap 5 中不起作用

我在尝试使用以下命令创建响应式菜单或下拉按钮时遇到问题Bootstrap 5一切似乎都正常导航图标和下拉图标出现但它不起作用当我单击nav图标或dropdown按钮无dropdown menu apears 我想特别提到的是我还包
如何使用 Greasemonkey 监视静态 HTML 页面的更改？使用哈希？

我希望我的 Greasemonkey 脚本仅在其访问的静态页面具有与以前完全相同的内容时运行现在我可以设置一个包含该页面哈希的变量我正在寻找一种动态散列页面的方法以便我可以将我的散列与生成的散列进行比较关于如何即时实现散列的任何想法
javascript 选择自定义光标 (svg)

我正在动态地将光标更改为悬停时的本地 svg element on mouseover function this css cursor url svgs pointer svg 9 30 auto 工作正常但我想选择该 svg 来操纵其
React Router v4 不渲染组件

React Router v4 渲染组件存在问题在应用程序初始加载时它将呈现与 URL 相对应的正确组件但是任何后续的组件Link单击不会呈现所需的组件图书馆反应路由器 4 2 2 https reacttraining com
回滚后是否应该删除迁移

我对 ruby 和 Rails 相当陌生刚刚开始了解迁移我的问题是回滚后删除迁移的最佳实践或正确时间是什么到目前为止我读到的内容是回滚后是否删除迁移的观点问题但是在团队中工作时删除迁移是否有任何重大影响以及保留迁移文件相对于删除
使用 Javascript 设置 cookie [重复]

这个问题在这里已经有答案了我正在尝试构建我的第一个移动应用程序它需要连接到我的 mysql 数据库并使用 json 返回数据这很好目前我有一个登录系统一旦确定用户名和密码存在它就会返回一条成功消息对于下一步我想在我的页面上使
下载所有 gems 依赖项

我想通过下载任何所需的文件并将它们带到另一台计算机来安装指南针没有互联网连接我已经下载了指南针的源包当我在未连接的计算机上运行 gem 时它抱怨缺少依赖项有什么解决办法吗这正是我遇到的问题经过一段时间的搜索后我找到了一个可以使
如何使用 JavaScript 或 jQuery 克隆 HTML 元素的样式对象？

我正在尝试克隆元素的样式对象这应该允许我在更改后重置所述元素的样式例如 el style left 50px curr style left 50px Modify the elements style The cloned style
如何从浏览器向服务器发送“页面将关闭”消息？

我想向每个 html 文档添加一个脚本 JavaScript 该脚本向服务器发送两条消息页面确实打开了页面将关闭此消息包含页面打开的时间打开消息应在文档加载时或加载完成时发送这是简单的部分 The close message
使用 next.js 进行服务器端渲染与传统 SSR

我非常习惯 SSR 意味着页面得到完全刷新并从服务器接收完整 HTML 的方法其中根据后端堆栈使用 razor pub other 进行渲染因此每次用户单击导航链接时它只会向服务器发送请求整个页面将刷新接收新的 HTML 这就是
在 iOS 7 Safari 中，如何区分通过边缘滑动与后退/前进按钮的 popstate 事件？

在 iOS 7 Safari 中现在有两种后退前进导航方式使用底部的传统后退前进按钮箭头或从屏幕边缘滑动我正在使用动画在 ajax 应用程序中的页面之间进行转换但如果用户通过边缘滑动进行导航我不想触发该转换因为这本身就是一个
Selenium Standalone Server 和 Java selenium Jar 文件有什么区别

这可能听起来像个愚蠢的问题但我想知道 Selenium 独立服务器和 Java selenium Jar 文件之间的区别我可以使用这两个 jar 文件导入 Webdriver 类如果 selenium 独立服务器提供了所有必需的 ja
如何通过索引访问 JSON 对象中的字段

我知道这不是最好的方法但我别无选择我必须通过索引访问 JSONObject 中的项目访问对象的标准方法是只写this objectName or this objectName 我还找到了一种获取 json 对象内所有字段的方法 fo
没有输入的 jQuery 日期选择器

我有一个相当复杂的网络应用程序我想向其中添加一些日期选择 UI 我遇到的问题是我无法从文档中弄清楚如何真正控制日期选择器的出现方式和时间不涉及任何表单元素不我不会添加秘密表单字段因此简单的开箱即用方法根本行不通我希望有人可以提供
使用velocity.js制作可拖动元素的动画

我正在使用velocity js 为用户拖动的可拖动 SVG 元素设置动画然而 velocity js 将先前的 mousemove 坐标排队并通过所有后续的 mousemove 坐标进行动画处理我想要的是velocity js 不要对

随机推荐

中是否需要添加cellspacing="0" cellpadding="0"？
Eric meyer重置CSS建议表仍然需要标记中的 cellspacing 0 有必要吗有什么好处border collapse collapse and border spacing 0 它只是建议使用 cellspacing 而

如何使用 Xamarin.from 应用程序部署数据库文件？

我在项目中创建了一个 sqlite 文件其中包含一些数据但我不知道如何将其链接到我的应用程序我希望数据可以加载到 Android 模拟器上我发现一个2015年发布的教程已经失效了比如新建一个FileAccessHelper类后找不

流行指数超出范围[重复]

这个问题在这里已经有答案了 N 8 f g 4 7 indexList range N print indexList print f g indexList pop f indexList pop g 在此代码中我收到一个错误指出 p

不一致的空相等检查 scala 2.11.7

编辑 Scala 2 12 6 中不再存在此问题原始问题针对 Scala 2 11 7 为什么有这么奇怪的警告 scala gt null asInstanceOf Double res0 Double 0 0 scala gt nul

SQLAlchemy 方言是否支持 JDBC？

我想通过 JDBC 驱动程序将 Superset 连接到数据库但据我所知还没有一种 SQLAlchemy 方言可以用于此目的最接近的选项可能是杰德比阿皮但它也没有 SQLAlchemy 方言 SQLAlchemy DB Engine

如何查看函数来自哪个包？

如何查看函数或其他对象源自哪个包例如函数 take 这可以通过 which macro which take Base

将列表中的每个项目重复另一个列表中指定的次数

我有两个清单 x and y gt gt gt x 2 3 4 gt gt gt y 1 2 3 我想用它们来创建一个新列表新列表中的每个元素将包含在x重复中相应元素指定的次数y 因此期望的输出是 gt gt gt new list 2

尝试访问其他文件时切换到 Kotlin DSL 未解析的参考

我在尝试对我的 gradle 文件使用 Kotlin DSL 时遇到错误 In build gradle app 我有一个函数可以检索存储在文件keys properties Groovy 中的函数如下 Retrieve key api

在spark中，参数“minPartitions”在SparkContext.textFile(path, minPartitions)中起什么作用？

在 Spark 中无论是 SparkContext 还是 JavaSparkContext 当您调用 sc textFile 时有一个参数是 minPartitions 这个参数意味着什么 minPartitions将被传递到 Hado

如何在 JLabel 中获取带有颜色的表情符号

我想用 Java 处理包含表情符号的字符串如下所示当我把这个字符串放入 JLabel 中时图形结果是这样的我怎样才能使它看起来像 JLabel 中的第一个谢谢表情符号只是 unicode 字符由字体指定一个字形来表示该字符所

laravel 5.4 ：Laravelcollective/html v5.3.0 需要照亮/视图 5.3。*

我正在使用Laravelcollective html v5 3 0 with laravel 5 3 现在我正在使用laravel 5 4 我有正在使用的表格Laravelcollective html v5 3 0 The compos

如何在 ReactJs 中使用轮选择器创建循环

我正在尝试以这种方式循环工作日周日周一周二周三周四周五周六周日周一周二就像水平圆圈一样为此我正在使用这个回购协议 https www npmjs com package vseslav react native ho

在 C# 中检查 double 是否为整数的好方法是什么？ [复制]

这个问题在这里已经有答案了可能的重复如何判断小数双精度数是否为整数 https stackoverflow com questions 2751593 how to determine if a decimal double is a

当 body 高度: 100% 无绝对 pos 时垂直居中 div

我有这个来填充窗口 html body height 100 然后容器也设置为 height 100 如何在不指定和设置高度以像素为单位的情况下将 div 与图像垂直居中without使用绝对定位使用padding top 50 底部

SKVideoNode 作为 SCNSphere 的纹理

我正在尝试使用 SKVideoNode 作为 SCNView 中 SCNSphere 的视频纹理源我正在关注这个答案 SKVideoNode 嵌入在 SKScene 中作为场景套件节点的纹理不起作用 https stackoverflo

错误：功能未正确部署

功能部署有错误要继续部署其他功能例如数据库请运行 firebase deploy except functions Error 功能未正确部署尝试运行部署 debug 例如 firebase debug deploy 就我而言该函

如何从 Angular 属性指令中访问元素 HTML？

Angular 文档提供了一个创建更改元素背景颜色的属性指令的示例 https angular io docs ts latest guide attribute directives html https angular io docs

doLayout 和包含在“Java Play!”模板中的区别是什么？

When 延伸 with doLayout你只能有一个子模板但是你可以include超过一个有什么区别最佳实践是什么它们是彼此相反的 doLayout被用作extends标签 extends 标签指定您想要扩展哪个模板以及doLa

xlswrite 如果是向量

我有一个 mat 文件其中包含titles time data 和 2 个列向量 time 1 2 3 4 5 and data 10 20 30 40 50 我创建了一个名为 table time data time data 的新单元

如何在 Ruby 中使用 selenium-webdriver/capybara 截取完整浏览器页面及其元素的屏幕截图？

我正在研究屏幕截图自动化特别是我正在努力实现以下目标提示用户提供网站不同页面的链接 X 提示用户输入类名 Y 我应该能够访问网站 X 登录页面提供登录详细信息假设它们已知单击提交按钮这应该将我重定向到主页页面然后我

热门标签

阿里巴巴取消

无人机仿真路线代码

PhotoScan

语言写的鼠标驱动程序

语言实现鼠标驱动

音频录音播放

自适应动态导航定位

设计模式实例详解

设计模式实例

中如何拉取

下配置开发

项目调试

最优化问题的求解与

最优化求解实际问题

适配指南请查收

不止更快

高效适配

OPPO

优化非线性优化

ncd

语言显示指定字符

谷歌全面反攻

Gemini

PaLM

流媒体服务器性能

设备工作不正常

Powered by Hwhale

如何在 Ruby 中使用 selenium-webdriver/capybara 截取完整浏览器页面及其元素的屏幕截图？

如何在 Ruby 中使用 selenium-webdriver/capybara 截取完整浏览器页面及其元素的屏幕截图？ 的相关文章

随机推荐

热门标签

如何在 Ruby 中使用 selenium-webdriver/capybara 截取完整浏览器页面及其元素的屏幕截图？的相关文章