使用 JSoup 解析 Html

2024-03-10

我正在尝试解析以下 URL 的 html:

http://ocw.mit.edu/courses/aeronautics-and-astronautics/16-050- Thermal-energy-fall-2002/ http://ocw.mit.edu/courses/aeronautics-and-astronautics/16-050-thermal-energy-fall-2002/

获取包含讲师姓名的“”标签的文本。所需的信息位于“”标签内,但我无法使用 JSoup 检索标签。我不知道我做错了什么,因为当我将标签保存在 Element 对象中时,我们将其称为“b”,并且我调用 b.getAllElements() 它不会显示

作为要素之一。这不是 Jsoup 的 getAllElements() 方法所做的吗?如果没有,请有人向我解释一下我显然缺少的层次结构,因为解析器无法找到

标签包含我需要的文本,在本例中是“Zoltan Spakovszky 教授”。

任何帮助将不胜感激。

public void getHomePageLinks()
{
    String html = "http://ocw.mit.edu/courses/aeronautics-and-astronautics/16-050-thermal-energy-fall-2002/";
    org.jsoup.nodes.Document doc = Jsoup.parse(html);

    Elements bodies = doc.select("body");

    for(Element body : bodies )
    {
        System.out.println(body.getAllElements());
    }

}

输出是:

http://ocw.mit.edu/courses/aeronautics-and-astronautics/16-050- Thermal-energy-fall-2002/ http://ocw.mit.edu/courses/aeronautics-and-astronautics/16-050-thermal-energy-fall-2002/

它不是应该打印出文档中 body 标记内的所有元素吗?


我对 JSoup 一无所知,但似乎如果您想要讲师的名字,您可以通过以下方式访问它:

Element instructor = doc.select("div.chpstaff div p");
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 JSoup 解析 Html 的相关文章

随机推荐