使用 JSoup 从 Google 搜索结果的所有页面检索所有链接

2023-12-10

我有以下使用 JSoup 在 java 中解析 HTML 的代码。

Document linksDoc = null; 
linksDoc = Jsoup.connect("http://www.google.com/search?q=jbutton").userAgent("Mozilla").get();
Elements titles = linksDoc.select("h3.r > a");

for(Element e: titles){
    System.out.println("text"+cnt+": " +e.attr("href"));
  } 

问题是我只能检索首页搜索结果链接。我应该怎么做才能从谷歌搜索结果的其余页面获取链接。


Add &start=10如果您想从第二页获取结果,请访问 URL。用于第三页使用&start=20等等。

Document linksDoc = Jsoup.connect("http://www.google.com/search?q=jbutton&start=10")
        .userAgent("Mozilla").get();
//...
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 JSoup 从 Google 搜索结果的所有页面检索所有链接 的相关文章

  • 在 Java 中克隆对象 [3 个问题]

    这样做会调用Asub的clone方法吗 或者Asub深度克隆是否正确 如果没有的话 有没有办法通过这种方法对Asub进行深度克隆呢 abstract class Top extends TopMost protected Object cl
  • 序列的排列?

    我有具体数量的数字 现在我想以某种方式显示这个序列的所有可能的排列 例如 如果数字数量为3 我想显示 0 0 0 0 0 1 0 0 2 0 1 0 0 1 1 0 1 2 0 2 0 0 2 1 0 2 2 1 0 0 1 0 1 1 0
  • Java 枚举与创建位掩码和检查权限的混淆

    我想将此 c 权限模块移植到 java 但是当我无法将数值保存在数据库中然后将其转换为枚举表示形式时 我很困惑如何执行此操作 在 C 中 我创建一个如下所示的枚举 public enum ArticlePermission CanRead
  • 过滤两次 Lambda Java

    我有一个清单如下 1 2 3 4 5 6 7 和 预期结果必须是 1 2 3 4 5 6 7 我知道怎么做才能到7点 我的结果 1 2 3 4 5 6 我也想知道如何输入 7 我添加了i gt i objList size 1到我的过滤器
  • 如何更改javaFX中按钮的图像?

    我正在使用javaFX 我制作了一个按钮并为此设置了图像 代码是 Image playI new Image file c Users Farhad Desktop icons play2 jpg ImageView iv1 new Ima
  • jdbc mysql loginTimeout 不起作用

    有人可以解释一下为什么下面的程序在 3 秒后超时 因为我将其设置为在 3 秒后超时 12秒 我特意关闭了mysql服务器来测试mysql服务器无法访问的这种场景 import java sql Connection import java
  • Hibernate 的 PersistentSet 不使用 hashCode/equals 的自定义实现

    所以我有一本实体书 public class Book private String id private String name private String description private Image coverImage pr
  • 像 Java 这样的静态类型语言中动态方法解析背后的原因是什么

    我对 Java 中引用变量的动态 静态类型和动态方法解析的概念有点困惑 考虑 public class Types Override public boolean equals Object obj System out println i
  • Java 和 Python 可以在同一个应用程序中共存吗?

    我需要一个 Java 实例直接从 Python 实例数据存储中获取数据 我不知道这是否可能 数据存储是否透明 唯一 或者每个实例 如果它们确实可以共存 都有其单独的数据存储 总结一下 Java 应用程序如何从 Python 应用程序的数据存
  • 尝试将 Web 服务部署到 TomEE 时出现“找不到...的 appInfo”

    我有一个非常简单的项目 用于培训目的 它是一个 RESTful Web 服务 我使用 js css 和 html 创建了一个客户端 我正在尝试将该服务部署到 TomEE 这是我尝试部署时遇到的错误 我在这里做错了什么 刚刚遇到这个问题 我曾
  • logcat 中 mSecurityInputMethodService 为 null

    我写了一点android应显示智能手机当前位置 最后已知位置 的应用程序 尽管我复制了示例代码 并尝试了其他几种解决方案 但似乎每次都有相同的错误 我的应用程序由一个按钮组成 按下按钮应该log经度和纬度 但仅对数 mSecurityInp
  • 关键字“table”附近的语法不正确,无法提取结果集

    我使用 SQL Server 创建了一个项目 其中包含以下文件 UserDAO java public class UserDAO private static SessionFactory sessionFactory static se
  • 如何使用 jUnit 将测试用例添加到套件中?

    我有 2 个测试类 都扩展了TestCase 每个类都包含一堆针对我的程序运行的单独测试 如何将这两个类 以及它们拥有的所有测试 作为同一套件的一部分执行 我正在使用 jUnit 4 8 在 jUnit4 中你有这样的东西 RunWith
  • Eclipse 启动时崩溃;退出代码=13

    I am trying to work with Eclipse Helios on my x64 machine Im pretty sure now that this problem could occur with any ecli
  • 我如何在java中读取二进制数据文件

    因此 我正在为学校做一个项目 我需要读取二进制数据文件并使用它来生成角色的统计数据 例如力量和智慧 它的设置是让前 8 位组成一个统计数据 我想知道执行此操作的实际语法是什么 是不是就像读文本文件一样 这样 File file new Fi
  • 在java中为组合框分配键

    我想添加一个JComboBox在 Swing 中这很简单 但我想为组合中的每个项目分配值 我有以下代码 JComboBox jc1 new JComboBox jc1 addItem a jc1 addItem b jc1 addItem
  • 如何将双精度/浮点四舍五入为二进制精度?

    我正在编写对浮点数执行计算的代码的测试 不出所料 结果很少是准确的 我想在计算结果和预期结果之间设置一个容差 我已经证实 在实践中 使用双精度 在对最后两位有效小数进行四舍五入后 结果始终是正确的 但是usually四舍五入最后一位小数后
  • CamcorderProfile.videoCodec 返回错误值

    根据docs https developer android com reference android media CamcorderProfile html 您可以使用CamcorderProfile获取设备默认视频编解码格式 然后将其
  • 双枢轴快速排序和快速排序有什么区别?

    我以前从未见过双枢轴快速排序 是快速排序的升级版吗 双枢轴快速排序和快速排序有什么区别 我在 Java 文档中找到了这个 排序算法是双枢轴快速排序 作者 弗拉基米尔 雅罗斯拉夫斯基 乔恩 本特利和约书亚 布洛赫 这个算法 在许多数据集上提供
  • Spring Boot 无法更新 azure cosmos db(MongoDb) 上的分片集合

    我的数据库中存在一个集合 documentDev 其分片键为 dNumber 样本文件 id 12831221wadaee23 dNumber 115 processed false 如果我尝试使用以下命令通过任何查询工具更新此文档 db

随机推荐

  • 如何更新 Web Profiler 工具栏以显示有关 ajax 请求的数据

    我目前正在构建一个完全支持 ajax 页面加载的应用程序 初始页面加载后 浏览网站仅加载内容 而不加载标题或菜单 整个应用程序运行良好 但我想刷新 Web Profiler 工具栏以显示最后的 ajax 请求信息 我从响应标头中获取了 xd
  • python 将 pandas 数据帧、参数和函数传递给 scipy.optimize.minimize

    我正在尝试使用 SciPy 的 scipy optimize minimize 函数来最小化我创建的函数 然而 我试图优化的函数本身是由其他函数构建的 这些函数基于 pandas DataFrame 执行计算 据我所知 SciPy 的最小化
  • 编译 C++ 代码时出现 ios::nocreate 错误

    同时 在 RHEL 5 0 上编译一个用 C 编写的包 我收到以下错误 gt 错误 nocreate不是以下成员std ios 源代码对应于 ifstream tempStr argv 4 ios in ios nocreate 我努力了
  • 停止应用程序洞察

    我们为 Azure 门户中托管的 Web 应用程序安装了 Application Insights 现在它发送报告等 应用程序刚刚启动 我们不需要所有这些数据 有没有办法完全停止 禁用 Application Insights 的所有数据收
  • Node js 在复制之前检查文件是否打开

    在将文件复制到另一个位置之前 我需要检查文件是否已打开 下面的代码告诉您打开文件时是否显示错误代码 EBUSY 但如果文件未打开 它将删除文件的内容 有没有更好的方法来获取这些信息 fs open my file dwg w functio
  • 如何估计 R 中图形线上的点的坐标?

    假设我有数据 x lt c 1900 1930 1944 1950 1970 1980 1983 1984 y lt c 100 300 500 1500 2500 3500 4330 6703 然后 我绘制这些数据并在已知的 x 和 y
  • Ivy 无法解析依赖关系的范围,该依赖关系是传递依赖关系的依赖关系

    我向 ivy xml 添加一个依赖项 让我们将其命名为 A 该文件在 Maven 中心有一个 pom 文件 Ivy 使用 ibiblio 来解决 Maven 依赖关系 添加到ivy xml 的依赖项 A 具有传递依赖项 B 到目前为止一切顺
  • $_Session 登录和注销 php 的“复杂性”

    我正在为大学做一个数据库项目 我在这里遇到了一个问题 我试图在没有会话时显示 登录 在有会话时显示 注销 但实际上即使在我登录后它仍然显示我 登录 并且我尝试 print r SESSION 它告诉我该变量未定义 我有一个注销文件 和一个
  • PHP 发送 UTF-8 邮件而不使用 PEAR::Mail PEAR::Mail_Mime

    我希望能够使用包含 8 位字符 的 PHP mail 发送电子邮件 它们将用在主题 消息和 发件人 标题中 在不使用 PEAR 包的情况下如何做到这一点 如果您不介意对不需要的单词进行编码 最简单的解决方案是将所有内容放入 base64 R
  • 上传文件之前生成 Firebase 存储下载 url

    Firebase Storage 有没有办法生成一个指向任何内容的下载网址 以便稍后将文件上传到该网址 类似的东西 在 Kotlin 中 fun generateItemPhotoUrl id String storageRef child
  • 调用链内的空合并

    如果我有一长串对象 每个对象都有可能在 Linq where 子句中返回 null 例如 SomeSource Where srcItem gt srcItem DataMembers SomeText Connection Connect
  • Realm 返回空对象列表

    我想从 Farmer 对象中获取 CropDataList 当我获取 Farmer 对象时 它不为空 但与 Farmer 对象关联的作物数据列表返回空 我可以通过 Stetho 查看数据库条目 并且列表中有一个条目 这是我的代码 publi
  • 使用 LINQ(赛程列表)形成锦标赛表

    I have an array of players string and now I need to get an array of pairs representing games playerN playerM to orginize
  • httr POST 请求 API 返回 400 错误

    我正在使用 R 中的 httr 包来尝试查询 postcode io API http postcodes io docs 我可以按照说明成功查询单个邮政编码 sample4 lt GET api postcodes io postcode
  • Bull队列:当作业失败时,如何停止队列处理剩余作业?

    我在用bull队列来处理一些作业 在当前场景中 每个作业都是某种操作 因此 每当队列中的操作列表中的操作 作业 失败时 队列就必须停止处理剩余的作业 操作 到目前为止我尝试过什么 所以我尝试在特定作业失败时暂停队列 接下来 队列在耗尽时恢复
  • Glassfish v4 和 SSL - 管理员不再起作用

    我已经完成了将 SSL 证书添加到 glassfish v4 中的步骤 我已经验证它可以通过浏览器和我的 java swing 客户端工作 我在客户端使用 apache 的 http 客户端库 不起作用的是管理控制台 成功导入 SSL 后
  • 如何在角度2中使用jquery?

    我知道我是否需要在 Angular 1 3 或 1 4 中使用第三方库 我需要对该东西进行指令并在我们的项目中使用它 现在我正在使用角度2 0 我想把这个做成angular 2 https jqueryui com autocomplete
  • minSdkVersion破解程序

    所以每当我添加
  • 使用 for 循环将输入分成两部分

    这就是我在尝试使用网络课程学习 Python 时陷入困境的地方 编写一个程序 采用 number1 number2 形式的单个输入行 其中两者都表示正整数 并输出两个数字的总和 例如 输入 5 12 时输出应为 17 我们不应该使用 spl
  • 使用 JSoup 从 Google 搜索结果的所有页面检索所有链接

    我有以下使用 JSoup 在 java 中解析 HTML 的代码 Document linksDoc null linksDoc Jsoup connect http www google com search q jbutton user