我们有一个系统,客户(主要是欧洲客户)输入文本(UTF-8),必须将其分发到不同的系统,其中大多数系统接受 UTF-8,但现在我们还必须将文本分发到仅接受美国的美国系统-Ascii 7 位
所以现在我们需要将所有欧洲字符转换为最接近的美国 Ascii 字符。有没有 Java 库可以帮助完成这项任务?
现在我们刚刚开始添加到翻译表,其中 Å(瑞典语 AA)->A 等,如果我们没有找到与输入的字符匹配的任何内容,我们将记录它并用问号替换并尝试在下一个版本中修复该问题,但这似乎非常低效,并且其他人之前一定已经做过类似的事情。
您可以使用以下命令来执行此操作(来自中的 NFD 示例)这个核心 Java 技术技术提示):
public static String decompose(String s) {
return java.text.Normalizer.normalize(s, java.text.Normalizer.Form.NFD).replaceAll("\\p{InCombiningDiacriticalMarks}+","");
}
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)