JSoup 不会获取所有项目?

2024-02-20

因此,我尝试使用 JSoup 解析一个简单的列表。不幸的是,程序仅返回列表中以 N 开头的条目之前的条目。我不知道为什么会这样。这是我的代码:

    public ArrayList<String> initializeMangaNameList(){
        Document doc;
        try {
            doc = Jsoup.connect("http://www.mangahere.com/mangalist/").get();
            Elements items = doc.getElementsByClass("manga_info");
            ArrayList<String> names = new ArrayList<String>();
            for(Element item: items){
                names.add(item.text());
            }
            return names;
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
        return null;
}

那么为什么列表不包含所有条目呢?网页有错误吗?或者也许是解析器?我可以使用解决方法来绕过此问题吗?首先是什么导致了这个问题?


好吧,这个问题是由 JSoup 1.72 及更高版本的更改引起的。您只需要更改默认设置,如下所示:

public ArrayList<String> initializeMangaNameList(){
    Document doc;
    try {
        doc = Jsoup.connect("http://www.mangahere.com/mangalist/").maxBodySize(0).get();
        Elements items = doc.getElementsByClass("manga_info");
        ArrayList<String> names = new ArrayList<String>();
        for(Element item: items){
            names.add(item.text());
        }
        return names;
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
    return null;

}

重要的区别是将 maxBodySize 设置为 0,以便允许无限大小的文件。更多信息可以在文档 https://jsoup.org/apidocs/org/jsoup/Connection.Request.html。 这将允许您拥有无限的主体大小并加载您需要的所有数据。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

JSoup 不会获取所有项目? 的相关文章

随机推荐

  • 父级 Flexbox 容器忽略子级 Flexbox 最小宽度

    很短的史前史 我的故事从奋斗开始overflow wrap break word 在弹性盒内工作 Flexbox 容器不想理解它的项目可以缩小 尽管该项目可以破坏长单词 body width 300px border 1px solid b
  • CSS相对位置/正常位置问题

    根据w3schools 相对位置值定义如下 relative 元素相对于其正常位置定位 因此 left 20 向元素的 LEFT 位置添加 20 个像素 我知道我可以获得相对定位的任何 DOM 对象 并使用它 我可以获得相对于原点的左侧或顶
  • VBA 宏将返回连续的月末

    这是我在这个网站上的第一篇文章 我需要有关一些 VBA 代码的帮助 该代码会将 31 07 00 放入单元格 B2 中 然后将每个月末日期放入该列中 并停止在单元格 B126 中的 31 11 2010 即单元格 B2 31 07 00 B
  • 当我上传 .png 图标时,“Android Asset Studio”会添加额外的空间,但当它使用其内部剪贴画时则不会。为什么?

    我正在尝试为我正在处理的一些 Android 应用程序创建一些漂亮的图标 有人引导我使用 Android Asset Studio 这是一个不错的在线工具 它可以创建完整的图标包 准备部署到我的 可怕的 碎片化的 Android 项目 re
  • 从中间向外循环数组的算法?

    我正在研究一种分而治之的算法 事实上 这是一种对多个输入点进行曲线拟合的算法 对于 划分 部分 我需要计算每个点的误差项 如果误差超过给定阈值 我希望在该点分割曲线并分别处理输入的左右部分 一个简单的循环就可以解决问题 但从当前部分的中间开
  • Payara5 服务器将无法部署:未知协议 RFB

    在干净的 eclipse 环境中 payara5 将不会部署 我已经使用 java 1 8 下载了正确版本的服务器 只需将其添加到新服务器即可启动它 我无法摆脱这个错误 payara 登陆页面可以工作 但管理控制台超时 任何帮助表示赞赏 2
  • 如何将正在运行的应用程序扩展到PCR中?

    如何将正在运行的应用程序扩展到PCR中 以及哪种 PCR 可以用于此目的 我假设您指的是 PC 平台上的 TPM 版本 1 2 因此您对以下规范文档感兴趣 TPM 主要部分 2 TPM 结构 http www trustedcomputin
  • 使用 .NET 实时读取文件中的更改

    我有一个经常更新的 csv 文件 大约每分钟 20 到 30 次 我想将新添加的行写入文件后立即将其插入数据库 The 文件系统观察者 http msdn microsoft com en us library system io file
  • Mac“find”和Linux“find”之间的区别[关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 我继承了一个脚本作为应用程序构建过程的一部分 当我在构建服务器 Ubuntu Precise 上运行它时 它运行良好 但是当我在我的 ma
  • 如何通过 RSA 生成唯一的公钥和私钥

    我正在构建一个自定义购物车 其中 CC 编号和到期日期将存储在数据库中直至处理 然后删除 我需要加密这些数据 显然 我想使用 RSACryptoServiceProvider 类 这是我创建密钥的代码 public static void
  • 用于转换许多元素的 dec2bin 函数的更快版本?

    我正在读取位图文件并进行转换each范围从 0 到 255 的 RGB 值的二进制 因此 240 x 320 位图将有 230400 个 RGB 值需要转换 原来的 dec2bin 函数太慢了 所以我编写了自己的函数 因为我知道我的值始终在
  • 没有名为 main 的模块,wkhtmltopdf 问题

    我是Python新手 但我发现的所有搜索结果对我来说都没用 C Users Aero gt pip install wkhtmltopdf Collecting wkhtmltopdf Using cached wkhtmltopdf 0
  • 如何将自定义 HTTP 标头注入 SuperAgent 发出的每个请求中?

    Clearly 超级特工 https visionmedia github io superagent 支持自定义 HTTP 标头 request post api pet send name Manny species cat set X
  • ScrollView 中的 Xamarin Center StackLayout

    我正在尝试水平居中StackLayout在一个ScrollView 但是 那StackLayout不是水平居中 它左对齐 我尝试将ScrollView但整个视图是不可滚动的 只有中心部分是可滚动的
  • Typescript用户定义的类型保护检查对象具有数组中的所有属性

    我正在尝试写一个用户定义的类型保护 https www typescriptlang org docs handbook advanced types html user defined type guards测试给定的值是否具有给定数组中
  • 我们可以在postman中读取excel中的数据进行js测试吗?

    我们可以在postman中读取excel中的数据进行js测试吗 或者 我们可以编写一个从 excel csv notepad 读取数据的 js 脚本吗 我写了一些 js 脚本来自动化我的 API 测试 我正在使用 Newman 从命令提示符
  • C# 文件处理:在可执行文件存在的目录中创建文件

    我正在创建一个独立的应用程序 该应用程序将分发给许多用户 现在 每个人都可以将可执行文件放置在其计算机上的不同位置 我希望在执行可执行文件的目录中创建一个新文件 因此 如果用户的可执行文件位于 C exefile 该文件是在那里创建的 但是
  • 如何更改 Fluent NHibernate 中小数的默认比例和精度?

    在我正在构建的应用程序中 我有许多具有特定精度和小数位数的小数字段 需要从数据库进行映射 我可以通过使用来实现这一点Precision and Scale 方法 public class ClassAMap ClassMap
  • Unity UI 中图像模糊或像素化

    我有一个 211x211 的图像 其设置如下 在我的统一用户界面中 它看起来模糊 像素化 我的统一图像宽度高度设置为 40x40 我做错了什么 即使我尝试过 2048x2048 图像 但仍然得到相同的模糊效果 图像不清楚 这是我的游戏视图
  • JSoup 不会获取所有项目?

    因此 我尝试使用 JSoup 解析一个简单的列表 不幸的是 程序仅返回列表中以 N 开头的条目之前的条目 我不知道为什么会这样 这是我的代码 public ArrayList