如何防止jsoup转换特殊字符? [复制]

2023-12-04

请看下面的简化示例:

    public static void main(String[] args) {
       String html = "<html>\n" +
                    " <head></head>\n" +
                    " <body>\n" +
                    "  <div> \n" +
                    "   <p> 2 <= X </p> \n" +
                    "  </div>\n" +
                    " </body>\n" +
                    "</html>";
        Document doc = Jsoup.parse(html);                    
        System.out.println(doc.select("p").outerHtml());
    }

这打印出来<p> 2 &lt;= X </p>但我希望所选的 html 部分能够按原样打印出来:<p> 2 <= X </p>。我如何告诉 jsoup 不要转换“


可以使用jsoup。

使用 jSoup 1.8.3 可以使用该方法解析器.unescapeEntities保留原来的html。

import org.jsoup.parser.Parser;
...
String html = Parser.unescapeEntities(original_html, false));

在某些以前的版本中,不存在此方法。

阅读更多内容这个链接。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何防止jsoup转换特殊字符? [复制] 的相关文章

随机推荐

  • 如何在 win32print 中使用 SetJob?

    我想使用 Python 清除或删除打印作业 但我怎样才能得到JobID win32print SetJob hPrinter JobID Level JobInfo Command 我怎样才能运行这段代码 jobs for p in win
  • 尝试使用 jQuery 访问 Instagram API

    我正在尝试使用 Instagram API 并在 do while 循环中发出 AJAX 请求 直到 next url 为 null 我想要这段代码做的就是通过发出连续的请求来获取所有关注者 直到完成为止 这段代码有什么问题 当我删除 do
  • 如何在 Java Swing 中的 JLabel 中设置行间距/高度?

    我有以下 JLabel 代码 JLabel someJLabel new JLabel first line br second line someJLabel setFont new Font Arial Font PLAIN 16 我想
  • 将 2 个数组映射到 1 个数组对象

    我有 2 个独立的数组 但它们都有相同的长度 如何将它们合并到一个数组对象中 以便以后轻松填充 例如 1 2 3 4 5 a b c d e 我希望我能有类似的东西 index 1 value a index 2 value b 我试过了
  • 无法在 T 中访问类 Object 中的 Scala 方法克隆 不允许访问受保护的方法克隆,因为

    我在 Scala 中的克隆方面遇到了麻烦 是否可以克隆任意类型 T 的对象 像这样的东西 import collection immutable Stack object Tester extends App trait Grand T l
  • 是否可以在 WAS Liberty Profile 中使用 Hibernate 5 作为 JPA 引擎

    我在 Liberty 项目中使用 4 3 11 但版本 5 中解决了 Hibernate 的一个错误 我尝试升级 但遇到了不同的异常 有人使用带有 Liberty Profile 的 Hibernate 5 x x 吗 您在 server
  • 从主动消息开始对话

    我是机器人框架的新手 所以如果这是基本的 我很抱歉 但我正在尝试向用户发送主动消息以开始对话 我正在使用以下示例 https github com microsoft BotBuilder Samples tree master sampl
  • Python从pandas数据框中删除停用词

    我想从我的 推文 列中删除停用词 如何迭代每一行和每个项目 pos tweets I love this car positive This view is amazing positive I feel great this mornin
  • 有没有办法控制宏扩展顺序

    我希望有人知道如何控制 指定宏扩展的顺序 这是上下文 32 bit increments processor has registers for set clear and invert define CLR OFF 1 define SE
  • 如何让python成功从互联网上下载大图片

    所以我一直在使用 urllib request urlretrieve URL FILENAME 下载互联网上的图像 它效果很好 但在某些图像上失败 它失败的似乎是较大的图像 例如 https i stack imgur com jQkbJ
  • 在 JPanel 之间切换

    我正在尝试制作一款游戏 游戏中有几个不同的屏幕 例如主菜单和实际的游戏屏幕 其中每一个都是一个单独的 jpanel 扩展 我已将它们中的每一个添加到我的 JFrame 中 这是一个名为 Game 的类 在我的游戏类中 我有以下方法 publ
  • 无法使用 FQL 获取 Facebook 群组中的所有用户

    我正在尝试使用以下 FQL 查询获取 Facebook 群组中每个用户的姓名 从 uid 所在的用户中选择名字 姓氏 从以下位置选择 uid group member 其中 gid 123 然而 该小组的 7000 名成员中 这只得到了大约
  • 如何计算 SQL Server 列中某个值连续出现的次数

    我有一张桌子Attendance在我的数据库中 Date Present 20 11 2013 Y 21 11 2013 Y 22 11 2013 N 23 11 2013 Y 24 11 2013 Y 25 11 2013 Y 26 11
  • 并行化 Numpy 向量运算

    让我们使用 例如 numpy sin 以下代码将返回数组中每个值的正弦值a import numpy a numpy arange 1000000 result numpy sin a 但我的机器有 32 个核心 所以我想利用它们 对于类似
  • 在鼠标下滚动窗口

    如果您查看一下 Visual Studio 2012 您会注意到 如果您使用鼠标滚轮 则鼠标下方的窗口将滚动 而不是焦点窗口 也就是说 如果将光标放在代码编辑器中 并将鼠标移到解决方案资源管理器窗口上并滚动 则解决方案资源管理器将滚动 而不
  • 为什么 python 中会缓存字符串对象

    这是示例 gt gt gt first string str This is some how cached gt gt gt second string str This is some how cached gt gt gt id fi
  • 在 Windows/Linux 上使用 python3 脚本检查可执行文件是 32 位还是 64 位

    我正在用 Python3 编写软件 更具体地说 Python 3 8 1 在某些时候 软件需要检查某个任意可执行文件是 64 位还是 32 位 经过一番研究 我发现了以下帖子 检查 exe 是 32 位还是 64 位 在这篇文章中 提供了以
  • 将 CPanel 中的所有 Google JDBC 服务 IP 地址列入白名单

    我正在尝试通过 JDBC 服务将 Google Docs 扩展连接到 MySQL 数据库 MySQL 数据库运行在需要使用 CPanel 的共享服务器上 CPanel 一次只能添加一个白名单规则 并且只能使用 通配符 与 0 个或多个任何类
  • EditorTemplate 中的 DropDownListFor 未选择值

    我有一个自定义对象的编辑器模板 在该编辑器模板中 我使用了几个 DropDownListFor 帮助程序 在每个模型中 我指定一个唯一的模型属性 带有预先选择的值 和包含所有选择选项的选择列表 Example 我知道正在填充选项值 从查看源
  • 如何防止jsoup转换特殊字符? [复制]

    这个问题在这里已经有答案了 请看下面的简化示例 public static void main String args String html n n n div n p 2 lt X p n div n n