在 R 中,藏文字符位于 data.frames 中时无法正确显示:
> Sys.setlocale("LC_CTYPE", "Tibetan")
[1] "Tibetan_China.950"
> data.frame(a="བོད་")
a
1 <U+0F56><U+0F7C><U+0F51><U+0F0B>
> Sys.setlocale("LC_CTYPE", "Dzongkha_Bhutan.950")
[1] "Dzongkha_Bhutan.950"
> data.frame(a="འབྲུག་ཡུལ་")
a
1 <U+0F60><U+0F56><U+0FB2><U+0F74><U+0F42><U+0F0B><U+0F61><U+0F74><U+0F63><U+0F0B>
中文按照说明就可以了here https://stackoverflow.com/questions/17715956/why-do-some-unicode-characters-display-in-matrices-but-not-data-frames-in-r:
> Sys.setlocale("LC_CTYPE", "Chinese")
[1] "Chinese (Simplified)_China.936"
> data.frame(a="中文")
a
1 中文
藏文字符在矩阵中也很好用:
> matrix("བོད")
[,1]
[1,] "བོད"
有人能解释一下这个问题吗?我使用的是 Windows 10。谢谢!
这似乎在 R 4.2.0 中已修复:
> Sys.setlocale("LC_CTYPE", "Tibetan")
[1] "Tibetan_China.utf8"
>
> data.frame(a="བོད་")
a
1 བོད་
在我发布这篇文章时,这并不是一个令人满意的答案,但现在效果肯定很好!
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)