JSoup 不会获取所有项目？

2024-02-20

因此，我尝试使用 JSoup 解析一个简单的列表。不幸的是，程序仅返回列表中以 N 开头的条目之前的条目。我不知道为什么会这样。这是我的代码：

    public ArrayList<String> initializeMangaNameList(){
        Document doc;
        try {
            doc = Jsoup.connect("http://www.mangahere.com/mangalist/").get();
            Elements items = doc.getElementsByClass("manga_info");
            ArrayList<String> names = new ArrayList<String>();
            for(Element item: items){
                names.add(item.text());
            }
            return names;
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
        return null;
}

那么为什么列表不包含所有条目呢？网页有错误吗？或者也许是解析器？我可以使用解决方法来绕过此问题吗？首先是什么导致了这个问题？

好吧，这个问题是由 JSoup 1.72 及更高版本的更改引起的。您只需要更改默认设置，如下所示：

public ArrayList<String> initializeMangaNameList(){
    Document doc;
    try {
        doc = Jsoup.connect("http://www.mangahere.com/mangalist/").maxBodySize(0).get();
        Elements items = doc.getElementsByClass("manga_info");
        ArrayList<String> names = new ArrayList<String>();
        for(Element item: items){
            names.add(item.text());
        }
        return names;
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
    return null;

}

重要的区别是将 maxBodySize 设置为 0，以便允许无限大小的文件。更多信息可以在文档 https://jsoup.org/apidocs/org/jsoup/Connection.Request.html。这将允许您拥有无限的主体大小并加载您需要的所有数据。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

html

list

Parsing

Jsoup

JSoup 不会获取所有项目？的相关文章

Android - 内容值覆盖现有行

我正在尝试使用插入值ContentValues 我已将 5 个值插入到 5 列中运行应用程序后我只有最后一组值的行ContentValues 前四组未插入 ContentValues cv new ContentValues cv pu
如何动态访问数据帧列表中的特定属性

我有一个数据它是数据框的列表我正在尝试访问列表中每个数据帧内的特定属性可以提取特定属性DP UniqueId使用下面的代码 gt attr new data A AA SpotfireColumnMetaData DP UniqueI
MAC OS 的 java.awt.Robot 类中出现无头环境错误

我正在尝试使用 JavaFX 应用程序捕获屏幕截图Robot class 这是我在我的应用程序中使用的代码 Rectangle screenBounds new Rectangle Screen getPrimary getBounds g
在 HTML 中移动选取框/下移文本

我正在尝试向下移动或移动 HTML 中的文本但我似乎无法将其移动到任何地方我添加了一个颜色命令来更改文本的颜色但似乎只是移动了它一直到顶部
Java中通过FTP创建文件夹层次结构

Java 是否有现成的功能可以在远程 FTP 服务器上创建文件夹层次结构 Apache Commons 确实提供了 FTP 客户端但我找不到创建目录层次结构的方法它确实允许创建单个目录 makeDirectory 但创建整个路径似乎并不
创建一个 int 类型的随机数组。爪哇

我需要创建一个随机的 int 数组并按我自己的类对其进行排序这是我制作数组的地方 public class MyProgram9 public static void main String args int list new int
使用java读取Excel工作表的单列

我有一张 Excel 表格我想编写一个方法该方法将参数作为要读取的列号并返回一个由该列中的所有数据组成的数组然后将该列元素放置在 xml 工作表中我怎样才能编写一个方法来做到这一点使用 Apache POI 您可以在他们的使用页
Apache HttpClient 执行时会在所有 HTTP 5XX 错误上抛出 IOException 吗？

The Apache HttpClient 文档 http hc apache org httpcomponents client ga httpclient apidocs org apache http client HttpClien
在Java中使用==而不是equals来比较不可变对象可以吗

考虑调用静态工厂方法 valueOf 的两个 Integer 类型的引用如下所示 Integer a Integer valueOf 10 Integer b Integer valueOf 10 考虑到Integer是不可变的使用而
将 @RequestLine 与 Feign 一起使用

我有一个工作 Feign 接口定义为 FeignClient content link service public interface ContentLinkServiceClient RequestMapping method Requ
jsf 中的类型未找到属性

我正在尝试调用 jsf 中使用 primefaces 的属性但我有错误 500 在托管bean PersonelBean 类型上找不到我正在使用 hibernate jsf 和 spring PersonelBean java Mana
RTCDataChannel发送方法不发送数据

我的 RTCDataChannel 遇到一个奇怪的问题我正在对 WebRTC 进行一些研究并且已经可以进行 WebRTC 音频视频聊天现在我想使用 RTCDataChannel 添加文本聊天和文件共享我已经像这样创建了 RTCDa
spring-boot-starter-web 2.4.4 导入 spring-web 和 spring-webmvc 版本 4.3.12 在 pom 中列为 5.3.5

我正在使用spring boot starter web我的项目中的版本2 4 4 当我查看其内容时它清楚地列出了 spring web 和 spring webmvc 5 3 5 版本但是由于某种原因我可以看到这个 spring
Java 中的可迭代求和？

有没有一个库可以做到这一点 public class Iterables private Iterables public static
如何在jpa中共享EntityManagerFactory

我是 jpa 的新手这是场景我正在开发一个 Web 应用程序其中多个用户可以登录当 user1 注销时我正在使用下面的代码 public static void closeEntityManagerFactory if enti
如何在粘贴时获取文本区域输入字段的新值？

我发现当我尝试从文本区域字段读取值时onpaste调用函数时我得到字段的旧值粘贴操作之前的值而不是新值粘贴操作之后的值以下是此行为的演示 http jsfiddle net qsDnr http jsfiddle net qsDn
有没有办法防止输入 type=“number” 获得多个点值？

我只想得到十进制值如 1 5 0 56 等但它允许多个点有什么办法可以预防吗您可以使用pattern属性
Web 应用程序似乎启动了名为 [22] 的线程，但未能停止它。这很可能造成内存泄漏

我有一个 Web 应用程序后端有 Servlet 部署在 tomcat 上该应用程序是简单的java应用程序我经常在服务器日志中看到此错误严重 Web 应用程序似乎启动了一个名为 22 但未能阻止它这很有可能造成内存泄漏是否存
如何使用 AEM 解析 org.apache.http.ssl？

最终我尝试在 Java 代码中使用 AWS S3 库来通过 AEM 启用服务器端 S3 上传但在安装依赖项和或由 AEM 识别时遇到了问题每次我添加新的依赖项时都会弹出五个问题在我尝试构建的这个包中这是我看到的错误 The i
生成签名和加密的 JWT

我正在尝试使用生成签名和加密的 JWT 令牌雨云智威汤逊 http connect2id com products nimbus jose jwt private void generateToken throws JOSEExceptio

随机推荐

父级 Flexbox 容器忽略子级 Flexbox 最小宽度

很短的史前史我的故事从奋斗开始overflow wrap break word 在弹性盒内工作 Flexbox 容器不想理解它的项目可以缩小尽管该项目可以破坏长单词 body width 300px border 1px solid b
CSS相对位置/正常位置问题

根据w3schools 相对位置值定义如下 relative 元素相对于其正常位置定位因此 left 20 向元素的 LEFT 位置添加 20 个像素我知道我可以获得相对定位的任何 DOM 对象并使用它我可以获得相对于原点的左侧或顶
VBA 宏将返回连续的月末

这是我在这个网站上的第一篇文章我需要有关一些 VBA 代码的帮助该代码会将 31 07 00 放入单元格 B2 中然后将每个月末日期放入该列中并停止在单元格 B126 中的 31 11 2010 即单元格 B2 31 07 00 B
当我上传 .png 图标时，“Android Asset Studio”会添加额外的空间，但当它使用其内部剪贴画时则不会。为什么？

我正在尝试为我正在处理的一些 Android 应用程序创建一些漂亮的图标有人引导我使用 Android Asset Studio 这是一个不错的在线工具它可以创建完整的图标包准备部署到我的可怕的碎片化的 Android 项目 re
从中间向外循环数组的算法？

我正在研究一种分而治之的算法事实上这是一种对多个输入点进行曲线拟合的算法对于划分部分我需要计算每个点的误差项如果误差超过给定阈值我希望在该点分割曲线并分别处理输入的左右部分一个简单的循环就可以解决问题但从当前部分的中间开
Payara5 服务器将无法部署：未知协议 RFB

在干净的 eclipse 环境中 payara5 将不会部署我已经使用 java 1 8 下载了正确版本的服务器只需将其添加到新服务器即可启动它我无法摆脱这个错误 payara 登陆页面可以工作但管理控制台超时任何帮助表示赞赏 2
如何将正在运行的应用程序扩展到PCR中？

如何将正在运行的应用程序扩展到PCR中以及哪种 PCR 可以用于此目的我假设您指的是 PC 平台上的 TPM 版本 1 2 因此您对以下规范文档感兴趣 TPM 主要部分 2 TPM 结构 http www trustedcomputin
使用 .NET 实时读取文件中的更改

我有一个经常更新的 csv 文件大约每分钟 20 到 30 次我想将新添加的行写入文件后立即将其插入数据库 The 文件系统观察者 http msdn microsoft com en us library system io file
Mac“find”和Linux“find”之间的区别[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我继承了一个脚本作为应用程序构建过程的一部分当我在构建服务器 Ubuntu Precise 上运行它时它运行良好但是当我在我的 ma
如何通过 RSA 生成唯一的公钥和私钥

我正在构建一个自定义购物车其中 CC 编号和到期日期将存储在数据库中直至处理然后删除我需要加密这些数据显然我想使用 RSACryptoServiceProvider 类这是我创建密钥的代码 public static void
用于转换许多元素的 dec2bin 函数的更快版本？

我正在读取位图文件并进行转换each范围从 0 到 255 的 RGB 值的二进制因此 240 x 320 位图将有 230400 个 RGB 值需要转换原来的 dec2bin 函数太慢了所以我编写了自己的函数因为我知道我的值始终在
没有名为 main 的模块，wkhtmltopdf 问题

我是Python新手但我发现的所有搜索结果对我来说都没用 C Users Aero gt pip install wkhtmltopdf Collecting wkhtmltopdf Using cached wkhtmltopdf 0
如何将自定义 HTTP 标头注入 SuperAgent 发出的每个请求中？

Clearly 超级特工 https visionmedia github io superagent 支持自定义 HTTP 标头 request post api pet send name Manny species cat set X
ScrollView 中的 Xamarin Center StackLayout

我正在尝试水平居中StackLayout在一个ScrollView 但是那StackLayout不是水平居中它左对齐我尝试将ScrollView但整个视图是不可滚动的只有中心部分是可滚动的
Typescript用户定义的类型保护检查对象具有数组中的所有属性

我正在尝试写一个用户定义的类型保护 https www typescriptlang org docs handbook advanced types html user defined type guards测试给定的值是否具有给定数组中
我们可以在postman中读取excel中的数据进行js测试吗？

我们可以在postman中读取excel中的数据进行js测试吗或者我们可以编写一个从 excel csv notepad 读取数据的 js 脚本吗我写了一些 js 脚本来自动化我的 API 测试我正在使用 Newman 从命令提示符
C# 文件处理：在可执行文件存在的目录中创建文件

我正在创建一个独立的应用程序该应用程序将分发给许多用户现在每个人都可以将可执行文件放置在其计算机上的不同位置我希望在执行可执行文件的目录中创建一个新文件因此如果用户的可执行文件位于 C exefile 该文件是在那里创建的但是
如何更改 Fluent NHibernate 中小数的默认比例和精度？

在我正在构建的应用程序中我有许多具有特定精度和小数位数的小数字段需要从数据库进行映射我可以通过使用来实现这一点Precision and Scale 方法 public class ClassAMap ClassMap
Unity UI 中图像模糊或像素化

我有一个 211x211 的图像其设置如下在我的统一用户界面中它看起来模糊像素化我的统一图像宽度高度设置为 40x40 我做错了什么即使我尝试过 2048x2048 图像但仍然得到相同的模糊效果图像不清楚这是我的游戏视图
JSoup 不会获取所有项目？

因此我尝试使用 JSoup 解析一个简单的列表不幸的是程序仅返回列表中以 N 开头的条目之前的条目我不知道为什么会这样这是我的代码 public ArrayList

JSoup 不会获取所有项目？

JSoup 不会获取所有项目？ 的相关文章

随机推荐

热门标签

JSoup 不会获取所有项目？的相关文章