如何使用 JTidy 从解析的 HTML 中获取错误/警告消息?

2024-02-11

我能够解析 HTML,但我想从解析的 HTML 中提取警告消息并将其显示给用户。

这是我的代码:

Tidy tidy = new Tidy();
StringBuffer StringBuffer1 = new StringBuffer("<b>Hello<u><b>I am tsting another one.....<i>another.....");
InputStream in = new ByteArrayInputStream(StringBuffer1.toString().getBytes("UTF-8"));
Writer stringWriter = new StringWriter();
    tidy.setPrintBodyOnly(true);
    tidy.setQuiet(true);
    tidy.setShowWarnings(true);
    tidy.setTidyMark(false);
    tidy.setXHTML(true);
    tidy.setXmlTags(false);
    Node parsedNode = tidy.parse(in, stringWriter);
    System.out.print(stringWriter.toString());

我在 jTidy 文档中注意到,从 r8 版本开始,您可以实现 jTidy privdes TidyMessageListener 接口,以便在 html 代码中收到警告和错误通知。

这里是doc http://jtidy.sourceforge.net/apidocs/org/w3c/tidy/TidyMessageListener.html

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 JTidy 从解析的 HTML 中获取错误/警告消息? 的相关文章

随机推荐

  • 在 Windows JRE 中导入 StartCom CA 证书

    我有一个 Java 应用程序访问使用 StartCom SSL 证书的服务 为此 我需要将 StartCom CA 证书添加到 Java 的信任库中 因为默认情况下它们还不在那里 我已经使用这些命令在 Linux 上成功完成了此操作 sud
  • 在 TypeScript 中覆盖接口的属性

    我知道禁止在扩展接口中覆盖接口的属性 修改其类型 我正在寻找一种替代解决方案 该解决方案允许我不复制第一个界面的内容 它非常大 下面是我的第一个天真的方法 鉴于该基本接口 interface OrginalInterface title s
  • 如何在Cloud Firestore中完成WHERE IN查询[重复]

    这个问题在这里已经有答案了 我试图弄清楚如何根据值是否位于我客户端的数组中来返回查询 到目前为止我还没有发现任何关于这个问题的信息 这可能吗 Firestore 现在支持 IN 查询 公告 https firebase googleblog
  • Hibernate:排序多对多映射

    考虑以下带有 JPA 注释的映射 ManyToMany cascade CascadeType ALL JoinTable name infotype validations joinColumns JoinColumn name info
  • 关闭按钮的背光

    我正在开发一个可能在晚上使用的 Android 应用程序 因此 我需要关闭按钮的背光 我怎样才能做到这一点 在我自己的手机上 背光会在一段时间后关闭 但在摩托罗拉 Droid 上 我认为不会发生这种情况 我正在使用唤醒锁来保持屏幕打开 我应
  • 如何在普通表和 fts3 表之间创建触发器?

    我在 FTS3 表和普通数据库表之间切换时遇到问题 我的应用程序非常简单 允许用户将联系人添加到数据库 他们可以搜索与搜索查询匹配的联系人 为什么我使用 fts 表 然后将结果显示在带有 onItemclicklistener 的列表上 但
  • 使用 PACKET_MMAP 和 PACKET_TX_RING 发送数据比“正常”(不使用)慢

    我正在用 C 语言编写一个流量生成器 使用 PACKET MMAP 套接字选项来创建环形缓冲区以通过原始套接字发送数据 环形缓冲区充满了要发送和发送的以太网帧sendto叫做 环形缓冲区的全部内容通过套接字发送 这应该比在内存中拥有缓冲区并
  • 如何使用refresh_token获取新的access_token(使用Flask-OAuthLib)?

    我正在构建一个网站 后端Flask框架 http flask pocoo org 我在其中使用Flask OAuthlib https flask oauthlib readthedocs org en latest 与谷歌进行身份验证 身
  • 在 Twitter API 中使用正则表达式

    我正在使用 Python 中的 Tweepy 库来搜索推文 我想知道是否可以使用正则表达式来搜索推文 我正在使用以下代码 query ARNOLD or SYLVESTER for tweet in tweepy Cursor api se
  • 缓存 Android 中 MapView 上正在绘制的内容

    我正在为我的大学校园开发一个应用程序 该应用程序在 MapView 中显示校园 然后使用geopoints在mapView上使用draw方法绘制校园建筑物的轮廓 该类延伸Overlay http code google com androi
  • EntityGraph - 您必须在描述符处定义提取组管理器才能在查询上设置提取组

    我想在 EclipseLink 和 GlassFish 中使用实体图 Entity NamedQueries NamedQuery name invoice all query SELECT i FROM Invoice i NamedEn
  • kubectl 端口转发多个服务

    我一直在尝试使用以下命令转发多个端口 kubectl port forward deployment service1 8080 8080 kubectl port forward deployment service2 8081 8081
  • 未找到“属性”段的资源

    当使用 ADO Net Data Services 客户端通过调用刷新实体时LoadProperty ctx BeginLoadProperty this Owner IAsyncResult ar gt 如果该属性是 它会在服务器上引发错
  • 工作流程中的 Dynamics CRM 当前日期占位符

    我已将工作流程附加到具有到期日期和时间的实体 那么指示当前时间的适当占位符是什么 CURRENT TIME Sultan 您的问题有点模糊 但如果您通过编辑器谈论 Dynamics CRM 工作流程 则工作流程运行的时间就是执行时间 为此
  • 无法将字符串转换为 pandas 中的浮点数(ValueError)

    我有一个从 JSON 输出创建的数据框 如下所示 Total Revenue Average Revenue Purchase count Rate Date Monday 1 304 40 CA 20 07 CA 2 345 1 54 存
  • 如何在 Python 中从给定 CDF 的分布中采样

    我想从概率分布中抽取样本CDF https en wikipedia org wiki Cumulative distribution function 1 e x 2 python scipy 等中有没有方法 使您能够从仅给定 CDF 的
  • Django 到底什么时候运行查询?

    虽然我了解 Django 的 QuerySet 和延迟执行的高级思想 但我没有在 Django 3 1 2 源代码中看到查询执行是如何触发的 即 数据库被命中 例如 根据Django 文档 https docs djangoproject
  • nasm 汇编linux定时器或睡眠

    我正在尝试找到一种方法让我的代码在继续之前等待两秒钟 我在保护模式下使用Linux的nasm 所以我只能使用int 80h 我找到了一个syscall称为 alarm 27 另一个叫 pause 29 但是 当我尝试使用这些时 程序会等待并
  • Android Fabric - 以自定义间隔发送捕获的异常

    根据 Fabric 文档面料文档 https docs fabric io android crashlytics caught exceptions html为了减少用户流量 仅在应用程序启动时发送捕获的异常 Crashlytics 在专
  • 如何使用 JTidy 从解析的 HTML 中获取错误/警告消息?

    我能够解析 HTML 但我想从解析的 HTML 中提取警告消息并将其显示给用户 这是我的代码 Tidy tidy new Tidy StringBuffer StringBuffer1 new StringBuffer b Hello u