使用 Java 读取 HTML+JavaScript

2023-12-20

我可以通过http读取HTML内容(例如,http://www.foo.com http://www.foo.com)使用 Java(使用 URL 和 BufferedReader 类)。然而,其中一些包含 JavaScript。我当前的应用程序无法处理 JavaScript。

使用 Java 通过 JavaScript 读取 HTML 内容的最佳方式是什么?

如果更容易的话,我愿意使用其他语言。

在此先感谢您的帮助。

更新 - 澄清:

一些 HTML 内容是使用 JavaScript 动态生成的。在浏览器上查看它们时,我可以看到结果(JavaScript 处理后的纯 HTML 形式)。

另一方面,当我的 Java 应用程序检索 HTML 内容时,它说我的应用程序上没有 JavaScript。

理想情况下,我希望能够使用我的 Java 应用程序获得与在浏览器上相同的结果。

感谢大家的回复。


HtmlUnit 具有良好的 JavaScript 支持,它(几乎)应该像 Web 浏览器一样解析 HTML。

  • http://htmlunit.sourceforge.net/ http://htmlunit.sourceforge.net/
  • http://htmlunit.sourceforge.net/javascript.html http://htmlunit.sourceforge.net/javascript.html
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 Java 读取 HTML+JavaScript 的相关文章

  • 在 vue.js 模板中包含外部脚本

    我是 Vue js 和 web pack 的新手 所以我决定使用 vue cli webpack 来构建初始应用程序 我试图包含一个外部脚本 例如组件 不需要的模板中 但是 Vue 警告这是不允许的 我的 index html 文件与最初生
  • Restful WS 中的 WSDL 等价物是什么?如果没有,消费者如何生成所需的客户端类?

    比如说 我在java中有生产者 在 net中有消费者 生产者有一个方法 需要 员工作为方法参数并在数据库中创建员工 对于基于 SOAP 的 ws dot net 客户端将调用 WSDL 并创建存根 包括 dot net 中的员工数据表示 现
  • setInterval 内的返回值

    我想在 setInterval 内返回一个值 我只想以一定的时间间隔执行一些操作 这就是我尝试过的 function git limit var i 0 var git setInterval function console log i
  • 使用 onBlur 事件上的值更新 React 输入文本字段

    我有以下输入字段 在模糊时 该函数调用服务来更新服务器的输入值 完成后 它会更新输入字段 我怎样才能让它发挥作用 我可以理解为什么它不允许我更改字段 但我能做些什么才能使其工作 我无法使用defaultValue因为我会将这些字段更改为其他
  • Window 与 Var 声明变量[重复]

    这个问题在这里已经有答案了 可能的重复 JavaScript 中使用 var 和不使用 var 的区别 https stackoverflow com questions 1470488 difference between using v
  • 在Java程序中计算zip文件的md5哈希值

    我有一个 zip 文件 在我的 Java 代码中我想计算 zip 文件的 md5 哈希值 有没有我可以用于此目的的 java 库 一些例子将非常感激 谢谢 几周前我通过这篇文章做到了这一点 http www javalobby org ja
  • Java 8 Stream - 为什么过滤器方法不执行? [复制]

    这个问题在这里已经有答案了 我正在学习使用java流进行过滤 但是过滤后的流没有打印任何内容 我认为过滤器方法没有被执行 我的过滤代码如下 Stream of d2 a2 b1 b3 c filter s gt s startsWith b
  • Meteor.js 登录事件

    因此 我对 Meteor 框架和 JavaScript 总体来说还很陌生 但我正在使用该框架开发一个小项目 以尝试让自己达到标准 基本上我正在开发一个微博客网站 目前 用户可以通过多种服务登录 fb google 等 我通过插入所需 url
  • Web服务连接超时和请求超时之间的区别

    WebClientTestService service new WebClientTestService int connectionTimeOutInMs 5000 Map
  • Java 中的可迭代求和?

    有没有一个库可以做到这一点 public class Iterables private Iterables public static
  • 使用文本遮盖视频

    是否可以使用 HTML CSS 文本来屏蔽视频 我已经找到并设置了这种工作方式 但没有一种允许文本后面有透明背景 例如 这支笔要求您进行某种填充 它并不是真正掩盖实际视频 而是创造幻觉 https codepen io dudleystor
  • 从 AJP 连接器请求中检索 Shibboleth 属性

    当我在 Apache 上运行 Shibboleth 身份验证时遇到了一个奇怪的问题 当 Tomcat7 在后端运行时 Apache 通过 mod proxy ajp 发送所有内容 Shibboleth 的参数也是如此 In the 文档 h
  • 有没有办法防止输入 type=“number” 获得多个点值?

    我只想得到十进制值 如 1 5 0 56 等 但它允许多个点 有什么办法可以预防吗 您可以使用pattern属性
  • 如何手动添加Android Studio依赖

    我多次尝试向我的项目添加依赖项 但每次都会出现错误 我想添加它们的依赖项是 de hdodenhof circleimageview 1 3 0 and com github bumptech glide glide 3 6 1 所以我想下
  • 如何使用 AEM 解析 org.apache.http.ssl?

    最终 我尝试在 Java 代码中使用 AWS S3 库来通过 AEM 启用服务器端 S3 上传 但在安装依赖项和 或由 AEM 识别时遇到了问题 每次我添加新的依赖项时 都会弹出五个问题 在我尝试构建的这个包中 这是我看到的错误 The i
  • 在 Google Apps 脚本中的文本前插入换行符

    我需要在 Google 文档中的某些文本之前插入一些换行符 尝试过这种方法但出现错误 var body DocumentApp getActiveDocument getBody var pattern WORD 1 var found b
  • 用于从链表中删除元素的大 O 表示法[重复]

    这个问题在这里已经有答案了 我正在阅读有关链接列表的内容 我发现 从链表中删除所需的元素需要 O n 运行时间 其中 n 是元素的数量 列表中的元素 http www cs mcgill ca dprecup courses IntroCS
  • 在测试期间调用预定方法[重复]

    这个问题在这里已经有答案了 我正在使用 Maven 开发 SpringBoot 应用程序 我有一个班级 Component有方法的注释m与 Scheduled initialDelay 1000 fixedDelay 5000 注解 这里f
  • FullCalendar 检查选择日是否有活动?

    我正在使用 Full Calendar js 插件 到目前为止一切顺利 但我想检查开始和结束之间的选择是否有事件 我只需要返回 true 或 false 基本上 如果日期选择中已经存在事件 我想阻止用户创建事件 var calendar c
  • Java applet 是否会违反同源策略

    我需要请求一些东西并从其他域获取信息 我知道由于同源政策 javascript 无法做到这一点 我的另一个选择是通过我的服务器发出代理请求 我不希望请求来自我的服务器的 IP 也不想为我的服务器创建额外的负载 并且希望客户端这样做 是否可以

随机推荐

  • 导出和导入 IndexedDB 数据

    我正在制作一个供我自己使用的工具 需要一个简单的数据库 这似乎是学习 HTML5 IndexedDB API 的好机会 但重要的是我在任何时候都不会丢失数据 我想备份浏览器的配置文件目录就可以进行备份 但我也希望可能使用不同的计算机 因此导
  • 从github导入ADT Eclipse中的android项目

    我正在尝试将 android 项目从 github 导入到 ADT Eclipse 中 但当我克隆它时 它在存储库中找不到任何项目 该仓库显然是一个android应用程序项目 从源代码来看 但没有找到可以导入的项目 我的步骤如下 在 包资源
  • 在函数重载中将右值引用实现为参数

    我已经询问过有关代码审查和软件工程的问题 但该主题不适合该网站 因此我在这里询问希望这不是基于意见的 我是一名 老派 C 开发人员 我已经停留在 C 2003 但现在我已经阅读了一些有关现代 C 11 17 的书籍 并且正在重写我的一些库
  • Python3.10源码venv已经改变

    我在个人仓库上做了一些 python leetcode 在我将 Kubuntu 升级到 22 04 后 我意识到当前的 venv 不起作用 我想我需要重新创建 venv 安装了 python3 10 venv 但我无法获取并激活它 事实上
  • Apache Spark:map、flatMap、mapPartitions、mapPartitionsWithIndex 的比较

    Apache Spark map flatMap mapPartitions mapPartitionsWithIndex 的比较 欢迎提出建议 以提高我们的知识 地图 函数 它有什么作用 通过提供的函数传递 RDD 的每个元素 即功能 平
  • 优化运行时间:改变igraph中边的权重需要很长时间。有没有办法优化它?

    我正在从 osmar 对象构建的 igraph 中搜索一组边 并希望更改这些边的权重 由于我的图表很大 因此这项任务需要很长时间 由于我在循环中运行此函数 因此运行时间变得更大 有什么办法可以优化这个吗 这是代码 library osmar
  • 使用后如何从 GPU 清理和卸载 WebGL 画布上下文?

    如何清理 WebGL 上下文程序并从 GPU 和 dom element 卸载程序 缓冲区和所有内容 我想确保我们没有乱扔垃圾 另外 如果可能的话 重用画布会很好 而且我不知道是否会这样 2d or webgl语境 您可以丢失对 gl 上下
  • 在 C# 中从 Msi 中的自定义操作强制重新启动

    我们如何在 C 自定义操作中提示安装后重新启动计算机 我们使用 VS 2005 的安装项目进行安装 并且需要以编程方式决定提示重新启动 因此不会在每次安装时发生 只是在某些安装上发生 更新 我们首先正在寻找已经内置于 MSI 自定义操作系统
  • WPF 中的自定义附加事件

    我可能在这里用错了术语 但我想我正在尝试创建一个附加事件 在 Surface SDK 中 您可以执行以下操作
  • 谷歌浏览器扩展制作中的内容安全策略错误

    我正在制作一个 chrome 扩展 它将在新选项卡中打开页面上的所有链接 这是我的代码文件 清单 json name A browser action which changes its icon when clicked version
  • 如何禁用 NGINX 文件日志记录

    我对 Nginx 很陌生 注意到每当我在本地访问我的服务器时 它都会记录 我想知道 我需要创建哪些配置文件 以及将它们放在哪里 以及我必须在其中放入什么来禁用该行为 我试图防止喷出 我正在 aws 上运行我的应用程序 并收到许多格式为 17
  • 无法使用“角色”包通过流星向用户添加角色

    我正在尝试使用 Atmosphere 上提供的 角色 包 但我无法让它与 Accounts onCreateUser 一起使用 我可以在 github 上获取示例 当我注册用户时 我想向他们添加角色 当我测试角色是否已分配时 它没有选择它
  • 卡片视图未显示

    我正在通过 android 中的回收器视图实现卡片视图 但我的卡片视图没有显示 我正在使用自定义适配器将数据填充到卡片视图 我已经尝试了所有方法 但卡片视图没有显示 MainActivity java public class MainAc
  • 如何从 pandas 中的字符串中提取前 8 个字符

    我在数据框中有一列 我正在尝试从字符串中提取 8 位数字 我该怎么做 Input Shipment ID 20180504 S 20000 20180514 S 20537 20180514 S 20541 20180514 S 20644
  • 限制拖放面板中的最大元素数

    我的网站上有一个可排序面板 jQuery UI 但需要将每列中的元素数量限制为最多 12 个 我尝试了一些方法 但似乎无法让它发挥作用 我需要看看 i 是否为 12 或更大 如果是 请不要更新 但我似乎做不到 有人有任何建议或可以推动我正确
  • 如何从脚本的纯色图像获取十六进制颜色代码?

    我正在编写一个脚本 将 Linux 机器上的背景更改为一组仅包含纯色的图像中的随机图像 我想做的是扩展此脚本以相应地主题某些应用程序 主要是终端应用程序 至少更改文本颜色 可能从深色背景切换到浅色背景等 我想知道我必须有哪些选项获取图像中颜
  • 谷歌天气 API 链接需要人工身份验证

    我使用开发了一个天气应用程序谷歌天气 http www google com ig api weather lincoln应用程序编程接口 但从今天起它停止工作了 当我尝试通过浏览器使用位置访问天气 API 时 它要求进行人工身份验证 当我
  • 当按钮大小改变时增加按钮字体大小

    我有一个 Qt 应用程序 其主窗口有五个按垂直顺序排列的按钮 它们都有相同的尺寸 我想做的就是当应用程序全屏显示时增加按钮标签的字体大小 我真的很感激一个不需要太多代码的解决方案 希望这是可以在 Qt Designer 中完成的事情 但我找
  • 将日期和时间转换为 Unix 时间戳

    我像这样显示日期和时间 2009 年 11 月 24 日 17 57 35 我想将它转换为 unix 时间戳 这样我就可以轻松地操作它 我需要使用正则表达式来匹配字符串的每个部分 然后从中计算出 unix 时间戳 我对正则表达式很糟糕 但我
  • 使用 Java 读取 HTML+JavaScript

    我可以通过http读取HTML内容 例如 http www foo com http www foo com 使用 Java 使用 URL 和 BufferedReader 类 然而 其中一些包含 JavaScript 我当前的应用程序无法