我有一个文章列表,每篇文章都有自己的标题和描述。不幸的是,从我使用的来源来看,无法知道它们是用什么语言编写的。
此外,文本并非完全用一种语言编写;几乎总是出现英语单词。
我认为我需要将字典数据库存储在我的机器上,但这感觉有点不切实际。你建议我做什么?
我会用猜测语言 http://code.google.com/p/guess-language/项目。
编辑:现在在位桶 https://bitbucket.org/spirit/guess_language
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)