将 HTML 转义字符串转换为纯 Unicode/ASCII [重复]

2024-02-17

可能的重复:
Java:如何像 HttpUtility.HtmlDecode 一样解码 Java 中的 HTML 字符实体? https://stackoverflow.com/questions/994331/java-how-to-decode-html-character-entities-in-java-like-httputility-htmldecode

有没有 Java/Android 方法来转换 HTML 转义字符串(例如Ö or ß)返回到它们的 ASCII/Unicode 表示形式(例如Ö or ß)?

我当然不想进行简单的字符串替换并尝试仅使用存在的每个 HTML 转义序列,我猜想有一个现成的解决方案吗?

Thanks!


用这个:

import org.apache.commons.lang.StringEscapeUtils;

public class StringEscapeUtilsTrial {
public static void main(String[] args) {
    String strHTMLInput = "<p>MyName<p>";
    String strEscapeHTML = StringEscapeUtils.escapeHtml(strHTMLInput);
    String strUnEscapeHTML = StringEscapeUtils.unescapeHtml(strEscapeHTML);
    System.out.println("Escaped HTML >>> " + strEscapeHTML);
    System.out.println("UnEscaped HTML >>> " + strUnEscapeHTML);
    }
}
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

将 HTML 转义字符串转换为纯 Unicode/ASCII [重复] 的相关文章

随机推荐