我已经使用 word2vec 从大型文档中生成了标记列表的向量。给定一个句子,是否可以从句子中标记的向量得到该句子的向量。
有不同的方法来获取句子向量:
-
Doc2Vec:您可以使用 Doc2Vec 训练数据集,然后使用句子向量。
-
Word2Vec 向量的平均值:你可以取一个句子中所有词向量的平均值。这个平均向量将代表你的句子向量。
-
使用 TF-IDF 计算 Word2Vec 向量的平均值:这是我推荐的最佳方法之一。只需将单词向量乘以它们的 TF-IDF 分数即可。只需取平均值即可代表您的句子向量。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)