有谁知道是否有一种简单的方法来检测Java中的字符集编码?在我看来,有些程序能够检测给定的数据使用哪个字符集,或者至少能够进行近似。
我想底层机制必须解码每个字符集中的数据,并选择具有最少未定义字符的字符集,然后选择哪个字符集更常见以打破平局。
有任何想法吗?
看一眼jchardet http://jchardet.sourceforge.net/,一个从 Mozilla 浏览器移植的库,专门用于“猜测”文档的字符集。
作为替代方案,cp探测器 http://cpdetector.sourceforge.net库有点新,专门用于检测文档的代码页。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)