我最近一直在使用很多字符集,在尝试为随机网页建立正确的字符集时发现了很多问题。
字符集可以在html文档的标题中设置,也可以在<head>
节,多次或有时声明被省略。尽管存在这些问题,chrome 每次都在设置最佳字符集方面做得很好。
我尝试过搜索来源 http://code.google.com/p/chromium/source/search但没有找到任何东西,因为我不知道去哪里寻找。
所以我的问题是我在哪里可以找到该算法?
Thanks
update:
有问题的例子:
文档的 HTTP 标头(基于服务器配置):
Content-type: text/html; charset=utf-8
该文档如下所示:
<?xml version="1.0" encoding="ISO-8859-1"?>
<html>
<head>
<meta charset="UTF-8">
<meta http-equiv="Content-type" content="text/html;charset=ISO-8859-1" />
</head>
<body>...</body>
</html>
将使用哪种编码来呈现文本?
Chrome 的用途https://github.com/google/compact_enc_det https://github.com/google/compact_enc_det
如果您想阅读调用该项目的实际代码,该函数是DetectTextEncoding https://github.com/chromium/chromium/blob/dea8b2608dd5d95e3869febc8b13d425291c19ef/third_party/blink/renderer/platform/text/text_encoding_detector.cc#L50在文件中third_party/blink/renderer/platform/text/text_encoding_detector.cc
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)