Puppeteer：屏幕截图惰性图像不起作用[重复]

2024-03-07

我似乎无法捕获屏幕截图https://today.line.me/HK/pc https://today.line.me/HK/pc成功地。

在我的 Puppeteer 脚本中，我还启动了滚动到页面底部并再次向上滚动以确保加载图像。但由于某种原因，它似乎不适用于上面的 URL 行。

function wait (ms) {
 return new Promise(resolve => setTimeout(() => resolve(), ms));
}

const puppeteer = require('puppeteer');

async function run() {
let browser = await puppeteer.launch({headless: false});
let page = await browser.newPage();
await page.goto('https://today.line.me/HK/pc', {waitUntil: 'load'});
//https://today.line.me/HK/pc
// Get the height of the rendered page
  const bodyHandle = await page.$('body');
  const { height } = await bodyHandle.boundingBox();
  await bodyHandle.dispose();

  // Scroll one viewport at a time, pausing to let content load
  const viewportHeight = page.viewport().height+200;
  let viewportIncr = 0;
  while (viewportIncr + viewportHeight < height) {
    await page.evaluate(_viewportHeight => {
      window.scrollBy(0, _viewportHeight);
    }, viewportHeight);
    await wait(4000);
    viewportIncr = viewportIncr + viewportHeight;
  }

  // Scroll back to top
  await page.evaluate(_ => {
    window.scrollTo(0, 0);

  });

 // Some extra delay to let images load
 await wait(2000);

await page.setViewport({ width: 1366, height: 768});
await page.screenshot({ path: './image.png', fullPage: true });
}

run();

对于任何想知道的人来说，有很多策略可以在 Puppeteer 中渲染延迟加载的图像或资源，但并非所有策略都同样有效。您尝试截屏的网站中的小实现细节可能会改变最终结果，因此，如果您希望实现能够在多种案例场景中正常运行，您将需要隔离每个通用案例并单独解决。

我知道这一点是因为我经营一家小型公司截图API https://www.getscreenshotapi.com服务人员和我必须单独处理许多案件。这是该项目的一项艰巨任务，因为似乎总是有新的问题需要通过每天使用的新库和 UI 技术来解决。

话虽这么说，我认为有一些渲染策略具有良好的覆盖范围。也许最好的方法是像OP那样将等待和滚动页面结合起来，但也要确保考虑到操作的顺序。这是 OP 原始代码的稍微修改版本。

//Scroll and Wait Strategy

function waitFor (ms) {
  return new Promise(resolve => setTimeout(() => resolve(), ms));
}

async function capturePage(browser, url) {
  // Load the page that you're trying to screenshot.
  const page = await browser.newPage();
  await page.goto(url, {waitUntil: 'load'}); // Wait until networkidle2 could work better.


  // Set the viewport before scrolling
  await page.setViewport({ width: 1366, height: 768});

  // Get the height of the page after navigating to it.
  // This strategy to calculate height doesn't work always though. 
  const bodyHandle = await page.$('body');
  const { height } = await bodyHandle.boundingBox();
  await bodyHandle.dispose();

  // Scroll viewport by viewport, allow the content to load
  const calculatedVh = page.viewport().height;
  let vhIncrease = 0;
  while (vhIncrease + calculatedVh < height) {
    // Here we pass the calculated viewport height to the context
    // of the page and we scroll by that amount
    await page.evaluate(_calculatedVh => {
      window.scrollBy(0, _calculatedVh);
    }, calculatedVh);
    await waitFor(300);
    vhIncrease = vhIncrease + calculatedVh;
  }

  // Setting the viewport to the full height might reveal extra elements
  await page.setViewport({ width: 1366, height: calculatedVh});

  // Wait for a little bit more
  await waitFor(1000);

  // Scroll back to the top of the page by using evaluate again.
  await page.evaluate(_ => {
    window.scrollTo(0, 0);
  });

  return await page.screenshot({type: 'png'});
}

这里的一些主要区别是：

您希望从一开始就设置视口并使用该固定视口进行操作。
您可以更改等待时间并引入任意等待来进行实验。有时，这会导致网络事件背后的元素被揭露。
将视口更改为页面的完整高度也可以显示元素，就像滚动一样。您可以使用垂直显示器在真实的浏览器中进行测试。但是，请确保返回到原始视口高度，因为视口也会影响预期的渲染。

这里需要理解的一件事是，单独等待并不一定会触发惰性资产的加载。滚动文档的高度允许视口显示那些需要在视口内加载的元素。

另一个需要注意的是，有时您需要等待相对较长的时间才能加载资源，因此在上面的示例中，您可能需要尝试每次滚动后等待的时间量。另外，正如我提到的，一般执行中的任意等待有时会影响资产是否加载。

一般来说，当使用 Puppeteer 进行屏幕截图时，您需要确保您的逻辑类似于真实的用户行为。您的目标是重现渲染场景，就好像有人在计算机中启动 Chrome 并导航到该网站一样。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

puppeteer

Puppeteer：屏幕截图惰性图像不起作用[重复] 的相关文章

Puppeteer：Element.hover() 不存在

我正在使用 puppeteer 从网站上抓取一些图像以及其他一些数据要更改图像我需要将鼠标悬停在列表项上我不断遇到有关 hover 的文档但没有成功然而 click 非常适合我的抓取的另一部分 const pptr require
如何检测与 puppeteer 一起使用的 chrome 版本？

我读到 puppeteer 使用最新版本的 chrome 我在哪里可以找到它正在使用的版本我不想访问窗口上的导航器对象来获取它基本上没有什么运行时只是想知道 puppeteer 作为一个包是否在某处列出了它的依赖项基本上我想从其他
如何在 puppeteer 中传递实验性 chrome 选项

我有一个用 python 编写的应用程序selenium https www selenium dev 其中设置了一些实验选项镀铬驱动程序 https chromedriver chromium org from selenium impo
如何使用 Puppeteer 登录 Google？

我正在使用 Puppeteer 并且正在尝试登录我的 Gmail 帐户 URL 目前我的代码输入电子邮件表单并提交输入然后当页面进入密码屏幕时无法输入密码这可能是因为它在技术上不是新页面而是相同的不管怎样当我在电子邮件页面上按
Puppeteer 启动器错误结果未定义

在 Windows 上测试我的项目后我将其部署到基于 Ubuntu 的虚拟机上这就是 Puppeteer 行为让我感到困惑的地方我确实安装了所有必需的依赖项但我有一种感觉我的错误不一定是由于缺乏依赖项以及更多有关配置问题而引起的
waitForSelector 找不到相关部分

我使用以下代码与 Puppeteer 来检查相关部分是否已加载但它总是返回加载错误这可能是什么原因缺少哪一部分我不明白我正在使用下面的代码 async function getResults lnk const results co
如何让puppeteer浏览器保持在后台运行而不跳转到前台？

使用时puppeteer通过a抓取一堆网站for loop 每当创建一个新页面时浏览器就会跳转到前台这妨碍了我在计算机上做其他事情即使我设置了以下参数它仍然不起作用那么我怎样才能让浏览器安静地运行而不跳到前台并打断我呢我需要跑进
如何避免“框架分离”错误异步验证或使用 Puppeteer 进行重定向？

以前的一个answer https stackoverflow com questions 51066987 puppeteer how can i wait for ajax request and process the result为
Node.js 中的活动句柄是什么

我发现我的应用程序活动句柄数不断增加活动句柄的数量究竟是多少这是我必须注意防止应用程序崩溃的事情吗活动手柄句柄是对开放资源例如打开的文件数据库连接或请求的引用为了理解为什么句柄应该处于关闭状态却可能处于活动状态我给你一个简
puppeteer 通过启用 cookie 和 Javascript 绕过 cloudflare

仅在 NodeJs gt 服务器端我正在做一些网页抓取一些页面受到 cloudflare anti ddos 页面的保护我正在尝试绕过此页面通过搜索我发现了很多关于隐身方法或 reCapcha 的文章但问题是 cloudflar
将 puppeteer 与 headless_shell 一起使用

我在用 https www npmjs com package puppeteer pdf https www npmjs com package puppeteer pdf其中有 puppeteer 作为依赖项 Heroku 对我 gt
puppeteer 无法在浏览器中加载 chrome 扩展

这是我第一次使用 puppeteer 我想打开 google chrome 页面并导航到我已安装的 chrome 扩展我尝试启用 chrome 扩展但是当我在中运行脚本时headless false模式下浏览器会弹出没有我的扩展程序
Puppeteer pdf 分页错误

我尝试用 puppetter 生成 pdf 文件它适用于一页但当我尝试生成多页 pdf 文档时我遇到了分页错误下面使用 HTML 模板来生成如果可以请你帮助我复制的前提条件将第一页填充到 100 高度并为下面的块添加标题 H
继续处理结果的 Null 值（Nodejs、Puppeteer）

我刚刚开始使用 Puppeteer Headless Chrome 和 Nodejs 我正在抓取一些测试站点当所有值都存在时一切都很好但如果该值丢失我会收到如下错误 Cannot read property src of null
Schmooze:: 使用 grover gem 转换 html2pdf 时处理失败+

respond to do format format html format pdf do grover Grover new http localhost 3000 generate report format A4 pdf grove
page.goto() 上的云函数超时

我在云函数中使用 puppeteer 运行测试如果我在本地机器上运行测试一切都很好如果我在云函数模拟器中运行测试也没关系但是当我将函数部署到云端时所有测试都停留在 page goto https 并且函数因超时而失败在我的例子中是
弹出表单可见，但 Puppeteer 中缺少 html 代码

我目前正在尝试从网站获取一些信息 https www bauhaus info https www bauhaus info 并在 cookie 弹出表单中失败到目前为止这是我的代码 async gt const browser awa
Puppeteer 无法在 VPS (DigitalOcean) 上工作

我在水滴中数字海洋 https www digitalocean com 我收到这个错误 node 5549 UnhandledPromiseRejectionWarning TimeoutError Navigation Timeout
消息“在 jest.setTimeout 指定的 5000 毫秒超时内未调用异步回调”

我正在使用 Puppeteer 和 Jest 来运行一些前端测试我的测试如下 describe Profile Tab Exists and Clickable settings user gt test Assert that you
通过 DevTools 协议从 Chromium 进行“向外”通信

我有一个页面在无头 Chromium 实例中运行我通过 DevTools 协议使用 Node js 中的 Puppeteer NPM 包来操作它我正在将脚本注入到页面中在某些时候我希望脚本给我回电并向我发送一些信息通过 DevTo

随机推荐

如何针对不同版本的 python 运行 py.test？

是否可以运行py test使用不带插件的不同版本的python 例如xdist or tox 最简单的方法是直接运行 pytest 模块 m 例如 python2 6 m pytest 请注意您必须安装 pytest那个版本Python
如何通过 Gradle/Android Studio 中的外部库项目中的代码修改来更新导入的模块

我正在开发一个 Android 应用程序最近从 Eclipse 迁移到 Android Studio 和 Gradle 在我的计划中我创建了 5 个 UI 库并将它们作为模块添加到我的项目中我创建的库被推送到我的 github 帐户
使用 python 禁用 selenium-chromedriver 中的地理定位

当我访问 https 网站时想要使用 Chromedriver 禁用 Chrome 中的自动地理定位 Tryed from selenium webdriver chrome options import Options chromeOp
VBA Excel宏毫秒计时

我正在尝试在 VB 中为 Excel 电子表格编写一个宏该宏以特定的时间间隔执行该时间间隔由电子表格本身包含的值以 Hz 为单位定义我的问题是我找到的用于以这种方式完成自动宏的代码似乎只允许秒精度因此任何高于 1Hz 的频率都
C# 中是否存在 else if 语句？

我在 C 中遇到过以下代码 if condition0 statement0 else if condition1 statement1 else if condition2 statement2 else if condition3 st
如何将一个 html 页面链接到另一个文件夹中的另一页面

无法将 rock paper scissors game2 文件夹中的页面 index2 html 0链接到 digital clock 文件夹中的 index html 不知道是代码错误还是其他什么顺便说一句我正在使用 Atom 我不
在 100% 高度表中滚动单元格

如果这个问题已经得到解答我很抱歉但是搜索 100 高度的东西有点困难我的问题是由于浏览器自动调整单元格大小我需要 100 高度的表格布局出于明显的原因我不想自己编写脚本它与其他 100 问题不同因为我需要一些单元格粘在
SonarQube 4.4 不显示带有 spock 测试的 grails 2.4.3 的 cobertura 单元测试或代码覆盖率

我的机器上安装了 SonarQube 4 4 我正在尝试为 grails 2 4 3 项目生成指标该项目具有用 Spock 框架编写的测试但是声纳不显示单元测试结果或单元测试覆盖范围我验证了 coberturacoverage xm
如何更改 PopupMenu 项目的字体

我想更改默认值font of 弹出菜单项目并使用我的自定义字体这是我用来创建的代码弹出菜单 PopupMenu pm new PopupMenu this v getMenuInflater inflate R menu main pm
在 GWT 客户端生成随机代码

我创建了一个 java gwt 应用程序我想在其中从客户端验证用户的电子邮件地址有什么方法可以在客户端生成随机 5 个字符代码任何形式的帮助将不胜感激像这样的东西吗 StringBuilder sb new StringBuilde
创建自定义事件 - 对象发送者还是类型发送者？

我搜索了档案发现了很多关于发件人是什么以及为什么应该使用该模式的问题但我没有看到任何有关自定义事件和type如果发件人假设我正在创建一个名为 Subscription 的自定义类它实现了 ISubscription 并且我有一些名为
removeAllCachedResponses无法清除sharedURLCache？

我做了一个按钮来清除缓存 NSURLCache sharedURLCache removeAllCachedResponses 完成此操作后我检查sharedURLCache的大小 NSInteger sizeInteger NSURLC
向 jsTree 添加 jQuery 自定义图像工具提示

这基本上是后续这个问题 https stackoverflow com questions 7096803 jquery jstree add a tooltip 我正在尝试向 jstree 添加自定义工具提示如果将鼠标悬停在图像文件上
Dapper 和枚举作为字符串

我正在尝试使用Dapper and Dapper Extensions并序列化我的enums在数据库上为string 现在它们被序列化为整数在VARCHAR字段代替有什么办法可以做到这一点吗我可以添加任何自定义类型映射吗如果我不能
将 URI 与 AndroidManifest 中的相匹配，例如 http://example.com/something

我正在努力应对
如何使用 WSO2 API Manager 将租户设置为调解器中的标头

我有一个 API 需要租户作为标头如果我创建一个自定义顺序
laravel查询，多余的行将被插入到表格发票详细信息中。例如FROM表包含6行，执行TO表后将有21行

ar po id variableAry explode ar foreach variableAry as var1 details11 DB table po estimations gt where po number var1 gt
嵌套角度材质选项卡

我需要向某些添加动态选项卡User Preferences屏幕主首选项选项卡可以是具有静态内容的静态选项卡但第二个选项卡应该嵌套mat tab元素这些额外的动态首选项来自后端然后我可以使用 ngFor渲染额外的选项卡我现在看到的问
处理 CloudKit 错误

我正在寻找有关在 Swift 中处理 CloudKit 错误的一般建议但在网上找不到好的示例这是我想知道的事情 1 每次出现错误的可能性时我是否应该考虑每种错误类型或者这实际上没有必要 2 我读到处理 CloudKit 错误的一种
Puppeteer：屏幕截图惰性图像不起作用[重复]

这个问题在这里已经有答案了我似乎无法捕获屏幕截图https today line me HK pc https today line me HK pc成功地在我的 Puppeteer 脚本中我还启动了滚动到页面底部并再次向上滚动以确保

Puppeteer：屏幕截图惰性图像不起作用[重复]

Puppeteer：屏幕截图惰性图像不起作用[重复] 的相关文章

随机推荐

热门标签