我不知道 StackOverflow 是否涵盖 NLP,所以我打算尝试一下。
我有兴趣找到特定领域中两个词的语义相关性,即“图像质量”和“噪声”。我正在做一些研究,以确定相机的评论对于相机的特定属性是正面还是负面。 (就像每一篇评论中的图像质量一样)。
然而,并不是每个人都在帖子中使用完全相同的措辞“图像质量”,所以我想看看是否有办法让我构建这样的东西:
“图像质量”,包括(“噪声”、“颜色”、“清晰度”等)
这样我就可以把所有的东西都包裹在一把大伞里。
我正在为另一种语言执行此操作,因此 Wordnet 不一定有帮助。不,我不为谷歌或微软工作,所以我也没有来自人们点击行为的数据作为输入数据。
然而,我确实有很多文本、后标记、分段等。
查看谷歌相似距离 -http://arxiv.org/abs/cs.CL/0412098 http://arxiv.org/abs/cs.CL/0412098例如。如果很多网页都包含它们,那么它们可能是相关的。
演示程序位于http://mechanicalinderella.com http://mechanicalcinderella.com
除此之外,您可以尝试翻译像 wordnet 这样的项目((谷歌翻译可以提供帮助),或者启动一个协作本体。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)