我怎样才能读到utf-8编码Mathematica 中的文本文件?
这就是我现在正在做的事情:
text = Import["charData.txt", "Text", CharacterEncoding -> "UTF8"];
但它告诉我
$CharacterEncoding::utf8: "The byte sequence {240} could not be interpreted as a character in the UTF-8 character encoding"
等等。我不知道为什么。我相信该文件是有效的 utf-8。
这是我正在尝试读取的文件:
http://dl.dropbox.com/u/38623/charData.txt
简短版本:Mathematica 的 UTF-8 功能不适用于超过 16 位的字符代码。如果可能,请改用 UTF-16 编码。但请注意,Mathematica 对 17 位以上字符代码的处理通常存在错误。长版本如下...
正如许多评论者指出的那样,问题似乎出在 Mathematica 对代码大于 16 位的 Unicode 字符的支持上。引用的文本文件中的第一个这样的字符是U+20B9B(
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)