我使用 mallet 制作了一个并行主题模型。
我想获得每个文档的热门词。
为此,我试图获取单词主题概率矩阵。
我将如何实现这一目标?
当您使用 MALLET 构建主题时,您有一个选项称为--word-topic-counts-file
。当您提供此选项并指定文件时,MALLET 会在文件中的每一行写入(主题、单词、概率)值。您稍后可以用 C、Java 或 R(当然,任何语言)读取此文件来创建您想要的矩阵。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)