Jsoup图像标签提取

2023-12-07

我需要使用 jsoup 从此 html 中提取图像标签

<div class="picture"> 
    <img src="http://asdasd/aacb.jpgs" title="picture" alt="picture" />
</div>

我需要提取这个 img 标签的 src ... 我正在使用此代码,但我得到空值

Element masthead2 = doc.select("div.picture").first();
String linkText = masthead2.outerHtml();
Document doc1 = Jsoup.parse(linkText);
Element masthead3 = doc1.select("img[src]").first();
String linkText1 = masthead3.html();

下面是获取图像源属性的示例:

public static void main(String... args) {
    Document doc = Jsoup.parse("<div class=\"picture\"><img src=\"http://asdasd/aacb.jpgs\" title=\"picture\" alt=\"picture\" /></div>");
    Element img = doc.select("div.picture img").first();
    String imgSrc = img.attr("src");
    System.out.println("Img source: " + imgSrc);
}

The div.picture img选择器查找 div 下的图像元素。

元素的主要提取方法有:

  • attr(name),获取元素属性的值,
  • text(),它获取元素的文本内容(例如在<p>Hello</p>, text() 是“你好”),
  • html(),它获取元素的内部 HTML (<div><img></div>html()=<img>), and
  • outerHtml(),它获取一个元素的完整 HTML (<div><img></div>html()=<div><img></div>)

您不需要像当前示例中那样重新解析 HTML,要么使用更具体的选择器首先选择正确的元素,要么点击element.select(string)方法进行筛选。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Jsoup图像标签提取 的相关文章

  • 在 Java 中克隆对象 [3 个问题]

    这样做会调用Asub的clone方法吗 或者Asub深度克隆是否正确 如果没有的话 有没有办法通过这种方法对Asub进行深度克隆呢 abstract class Top extends TopMost protected Object cl
  • Spring应用中Eureka健康检查的问题

    我正在开发一个基于 Spring 的应用程序 其中包含多个微服务 我的一个微服务充当尤里卡服务器 到目前为止一切正常 在我所有其他微服务中 用 EnableEurekaClient 我想启用这样的健康检查 应用程序 yml eureka c
  • Junit:如何测试从属性文件读取属性的方法

    嗨 我有课ReadProperty其中有一个方法ReadPropertyFile返回类型的Myclass从属性文件读取参数值并返回Myclass目的 我需要帮助来测试ReadPropertyFile方法与JUnit 如果可能的话使用模拟文件
  • 使用 LinkedList 实现下一个和上一个按钮

    这可能是一个愚蠢的问题 但我很难思考清楚 我编写了一个使用 LinkedList 来移动加载的 MIDI 乐器的方法 我想制作一个下一个和一个上一个按钮 以便每次单击该按钮时都会遍历 LinkedList 如果我硬编码itr next or
  • .properties 中的通配符

    是否存在任何方法 我可以将通配符添加到属性文件中 并且具有所有含义 例如a b c d lalalala 或为所有以结尾的内容设置一个正则表达式a b c anything 普通的 Java 属性文件无法处理这个问题 不 请记住 它实际上是
  • org.apache.hadoop.security.AccessControlException:客户端无法通过以下方式进行身份验证:[TOKEN,KERBEROS] 问题

    我正在使用 java 客户端通过 Kerberos 身份验证安全访问 HDFS 我尝试打字klist在服务器上 它显示已经存在的有效票证 我收到的异常是客户端无法通过以下方式进行身份验证 TOKEN KERBEROS 帮助将不胜感激 这是一
  • 如何在java中将一个数组列表替换为另一个不同大小的数组列表

    我有两个大小不同的数组列表 如何从此替换 ArrayList
  • 过滤两次 Lambda Java

    我有一个清单如下 1 2 3 4 5 6 7 和 预期结果必须是 1 2 3 4 5 6 7 我知道怎么做才能到7点 我的结果 1 2 3 4 5 6 我也想知道如何输入 7 我添加了i gt i objList size 1到我的过滤器
  • HSQL - 识别打开连接的数量

    我正在使用嵌入式 HSQL 数据库服务器 有什么方法可以识别活动打开连接的数量吗 Yes SELECT COUNT FROM INFORMATION SCHEMA SYSTEM SESSIONS
  • Java 公历日历更改时区

    我正在尝试设置 HOUR OF DAY 字段并更改 GregorianCalendar 日期对象的时区 GregorianCalendar date new GregorianCalendar TimeZone getTimeZone GM
  • Java 集合的并集或交集

    建立并集或交集的最简单方法是什么Set在 Java 中 我见过这个简单问题的一些奇怪的解决方案 例如手动迭代这两个集合 最简单的单行解决方案是这样的 set1 addAll set2 Union set1 retainAll set2 In
  • 将流转换为 IntStream

    我有一种感觉 我在这里错过了一些东西 我发现自己做了以下事情 private static int getHighestValue Map
  • 将 MOXy 设置为 JAXB 提供程序,而在同一包中没有属性文件

    我正在尝试使用 MOXy 作为我的 JAXB 提供程序 以便将内容编组 解组到 XML JSON 中 我创建了 jaxb properties 文件 内容如下 javax xml bind context factory org eclip
  • 如何在用户输入数据后重新运行java代码

    嘿 我有一个基本的java 应用程序 显示人们是成年人还是青少年等 我从java开始 在用户输入年龄和字符串后我找不到如何制作它它们被归类为 我希望它重新运行整个过程 以便其他人可以尝试 的节目 我一直在考虑做一个循环 但这对我来说没有用
  • Spring Boot Data JPA 从存储过程接收多个输出参数

    我尝试通过 Spring Boot Data JPA v2 2 6 调用具有多个输出参数的存储过程 但收到错误 DEBUG http nio 8080 exec 1 org hibernate engine jdbc spi SqlStat
  • 如何对不同的参数类型使用相同的java方法?

    我的问题 我有 2 个已定义的记录 创建对象请求 更新对象请求 必须通过实用方法进行验证 由于这两个对象具有相同的字段 因此可以对这两种类型应用相同的验证方法 现在我只是使用两种方法进行重载 但它很冗长 public record Crea
  • 使用 AsyncTask 传递值

    我一直在努力解决这个问题 但我已经到了不知道该怎么办的地步 我想做的是使用一个类下载文件并将其解析为字符串 然后将该字符串发送到另一个类来解析 JSON 内容 所有部件都可以单独工作 并且我已经单独测试了所有部件 我只是不知道如何将值发送到
  • 如何使用 jUnit 将测试用例添加到套件中?

    我有 2 个测试类 都扩展了TestCase 每个类都包含一堆针对我的程序运行的单独测试 如何将这两个类 以及它们拥有的所有测试 作为同一套件的一部分执行 我正在使用 jUnit 4 8 在 jUnit4 中你有这样的东西 RunWith
  • 使用 CXF-RS 组件时,为什么我们使用 而不是普通的

    作为后续这个问题 https stackoverflow com questions 20598199 对于如何正确使用CXF RS组件我还是有点困惑 我很困惑为什么我们需要
  • 如果没有抽象成员,基类是否应该标记为抽象?

    如果一个类没有抽象成员 可以将其标记为抽象吗 即使没有实际理由直接实例化它 除了单元测试 是的 将不应该实例化的基类显式标记为抽象是合理且有益的 即使在没有抽象方法的情况下也是如此 它强制执行通用准则来使非叶类抽象 它阻止其他程序员创建该类

随机推荐

  • 指针前一变量

    据我所知 在 C 中检查指针是否是数组末尾的一个元素是完全合法的 如下所示 char arr 16 for char ptr arr ptr arr sizeof arr sizeof arr 0 ptr some code 我的问题是这样
  • MSbuild 任务失败,因为“任何 CPU”解决方案的构建顺序不正确

    我在 Teambuild 中构建两种解决方案 一种是应用程序本身 另一种是 WiX 安装程序 我想使用 任何 CPU 构建配置来构建应用程序 并使用 x86 来构建安装程序 我在项目文件中首先列出了 任何 CPU 解决方案 但 Teambu
  • pandas 按两列值过滤行,不区分大小写

    我有一个简单的数据框 如下所示 Last Known Date ConfigredValue ReferenceValue 0 24 Jun 17 False FALSE 1 25 Jun 17 FALSE FALSE 2 26 Jun 1
  • 正则表达式 WORD 的最后一个字符

    我正在尝试匹配单词中的最后一个字符 WORD 是非空白字符的序列 n r t f 或匹配 的空行 我为此所做的表达是 n t r f n t r f 正则表达式匹配空白字符或行尾后面的非空白字符 但我不知道如何阻止它从结果中排除以下空白字符
  • Swift 计算属性不能在 init 中使用?

    我正在尝试将 MultipeerConnectivity 框架与 Swift 一起使用 我有以下属性 var peerId MCPeerID let advertiser MCNearbyServiceAdvertiser let brow
  • 混合服务器端 java 和客户端 javascript 图表库?

    是否有一个库可以用 Java 和 Javascript 为相同的数据生成相同的图表 我的任务是 显示一些华丽的动态图表在浏览器中 更好地使用动态工具提示 缩放等 我在这里考虑Javascript 并在服务器端用 Java 生成相同 或足够相
  • 为什么 (Excel VBA) 组合框更改事件每次引用其属性之一时都会触发?

    我是这个论坛的第一次用户 这是我的场景 在用户表单上 我有一个组合框 两个文本框和一个 确定 按钮 当用户从组合框的下拉列表中进行选择时 组合框的更改事件将被触发 事件处理代码将根据用户的选择使用工作表中的信息填充文本框 然后 用户可以编辑
  • 从字符串中获取价格值

    我有一个字符串 其中价格值 544 50 可以位于字符串中的任何位置 例如 HP G60 630US 笔记本电脑 笔记本电脑 RadioShack com gt 259 97 radioshack com 我需要从字符串中获取值 259 9
  • 类型错误:“dict_keys”对象不支持索引

    def shuffle self x random None int int x random random random gt shuffle list x in place return None Optional arg random
  • 使用 PHPMailer 和 GMAIL SMTP 发送电子邮件

    我已经阅读了网络上的每个示例 但似乎仍然无法连接到 GMAIL SMTP 这是我正在运行的代码 include phpMailer class phpmailer php path to the PHPMailer class mail n
  • 多个枚举的国际化(枚举值的翻译)[重复]

    这个问题在这里已经有答案了 再次讨论过的事情before我想分享 我的 解决方案并寻求增强功能 其他方法或最佳实践 我有几个需要国际化的枚举 我需要将枚举值翻译成某些语言以便在 jsf 页面中显示它们 示例枚举 public enum Tr
  • java.io.IOException:收到的身份验证质询为空

    我需要获取响应代码 但它抛出 IOException 我不知道怎么了 try url new URL urlBuilder toString conn HttpURLConnection url openConnection conn se
  • 如何将 UCS2 字符串转换为 UTF8?

    如何将 UCS2 每个字符 2 个字节 的字符串转换为 Ruby 中的 UTF8 字符串 你应该调查一下iconv 它是 Ruby 标准库的一部分 它是为这项任务而设计的 具体来说 Iconv iconv utf 8 utf 16 str
  • 如何在子窗口出现时通过单击父窗口上的按钮来禁用父窗口

    我在jsp中设计了一个窗口 其中有一个搜索按钮 当用户单击 搜索 按钮时 会出现新窗口 但此时我希望我的父窗口被禁用 这样当用户尝试在父窗口上执行任何操作时 在 搜索 表单关闭之前 它不应该允许 如果有人知道如何执行此操作 请告诉我 我已经
  • MySQL 插入后和更新后触发

    我有两张表 其中一张名为att如下 CREATE TABLE att SID varchar 50 NOT NULL CID varchar 50 NOT NULL Date date NOT NULL H1 varchar 1 NOT N
  • 如何获取和修改 Android 上支持的音频文件的元数据?

    背景 安卓支持各种音频文件编码和解码 我使用将音频录制到音频文件中android media MediaRecorder类 但我也希望显示有关我记录的文件的信息 不是标准数据 但仍然只是文本 甚至可能由用户配置 并且我认为最好将此信息存储在
  • C++,为什么结构/类中不需要前向声明

    在 C 中 为什么可以编译以下内容 struct test void foo this gt bar int bar 但不是以下内容 void foo bar int bar 需要明确的是 我确实明白在第二种情况下foo缺乏前瞻性声明bar
  • 字符串中 JSON 控制字符的转义

    在用 Java 编写 JSON 解析器时 我遇到了一个 外观 问题 在 JSON 规范中 明确指出 Javascript 控制字符与例如相同 在 C 和 Java 中 如 n 或 t 我遇到的问题是 当 JSON 字符串中存在控制代码时 因
  • 如何打开通过 Intent.ACTION_VIEW 从​​ ACTION_CREATE_DOCUMENT 获取的文件 Uri

    我的应用程序请求android net Uri来自用户通过Intent ACTION CREATE DOCUMENT这边走 Intent intent new Intent Intent ACTION CREATE DOCUMENT int
  • Jsoup图像标签提取

    我需要使用 jsoup 从此 html 中提取图像标签 div class picture img src http asdasd aacb jpgs title picture alt picture div 我需要提取这个 img 标签