我可以通过http读取HTML内容(例如,http://www.foo.com http://www.foo.com)使用 Java(使用 URL 和 BufferedReader 类)。然而,其中一些包含 JavaScript。我当前的应用程序无法处理 JavaScript。
使用 Java 通过 JavaScript 读取 HTML 内容的最佳方式是什么?
如果更容易的话,我愿意使用其他语言。
在此先感谢您的帮助。
更新 - 澄清:
一些 HTML 内容是使用 JavaScript 动态生成的。在浏览器上查看它们时,我可以看到结果(JavaScript 处理后的纯 HTML 形式)。
另一方面,当我的 Java 应用程序检索 HTML 内容时,它说我的应用程序上没有 JavaScript。
理想情况下,我希望能够使用我的 Java 应用程序获得与在浏览器上相同的结果。
感谢大家的回复。
HtmlUnit 具有良好的 JavaScript 支持,它(几乎)应该像 Web 浏览器一样解析 HTML。
- http://htmlunit.sourceforge.net/ http://htmlunit.sourceforge.net/
- http://htmlunit.sourceforge.net/javascript.html http://htmlunit.sourceforge.net/javascript.html
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)