gensim

为什么 Gensim doc2vec 给出 AttributeError: 'list' object has no attribute 'words'？

我正在尝试使用以下代码来实验 gensim doc2vec 据我从教程中了解到它应该有效然而它给出了属性错误列表对象没有属性单词 from gensim models doc2vec import LabeledSentence

python3x gensim Word2Vec

word2vec 模型由字符而不是单词组成

我正在尝试使用 Gensim 在波斯语上制作一个 word2vec 模型其中以空格作为字符分隔符我使用 python 3 5 我遇到的问题是我给出了一个文本文件作为输入它返回一个模型该模型仅包含每个字符而不是单词我还以推荐的单

gensim Word2Vec

加载 word2vec 时出现 UnicodeDecodeError 错误

详细描述我开始使用词嵌入并发现了大量有关它的信息到目前为止我知道我可以训练自己的词向量或使用以前训练过的词向量例如 Google 或 Wikipedia 的词向量这些向量可用于英语但对我来说没有用因为我正在处理以下语言中的文

python Word2Vec gensim pythonunicode polyglot

gensim 的 get_document_topics 方法返回的概率加起来不等于 1

有时它返回所有主题的概率并且一切都很好但有时它只返回几个主题的概率并且它们加起来不等于一似乎这取决于文档一般来说当它返回很少的主题时概率加起来大约为 80 那么它只返回最相关的主题吗有没有办法强制它返回所有概率也许我遗漏了一些

textmining gensim LDA topicmodeling

每次我在同一语料库上训练时，LDA 模型都会生成不同的主题

我正在使用Pythongensim从包含 231 个句子的小语料库中训练潜在狄利克雷分配 LDA 模型然而每次我重复这个过程它都会产生不同的主题为什么相同的LDA参数和语料每次生成不同的主题如何稳定话题生成我正在使用这个语料库

python NLP LDA topicmodeling gensim

我正在使用 Word2Vec 和 gensim 在 python 中出现“init() 获得意外的关键字参数'文档'”此错误

我正在使用 Word2vec 和 gensim 进行项目 model gensim models Word2Vec documents userDataFile txt size 150 window 10 min count 2 work

python gensim Word2Vec

LDA Mallet 调用进程错误

我正在尝试实现以下代码 import os os environ update MALLET HOME r c mallet 2 0 8 mallet path C mallet 2 0 8 bin mallet ldamallet gen

python3x gensim LDA mallet

在 Tensorboard 投影仪中可视化 Gensim Word2vec 嵌入

我只看到了几个提出这个问题的问题但没有一个有答案所以我想我不妨尝试一下我一直在使用 gensim 的 word2vec 模型来创建一些向量我将它们导出为文本并尝试将其导入到嵌入投影仪的张量流实时模型中一个问题没用它告诉我张量

python tensorflow gensim tensorboard wordembedding

使用 t-sne 可视化从 gensim 生成的 word2vec

我使用 gensim 在我自己的语料库上训练了 doc2vec 和相应的 word2vec 我想使用 t sne 和单词来可视化 word2vec 如图所示图中的每个点也带有单词我在这里看了一个类似的问题 word2vec 上的 t

scikitlearn datavisualization gensim Word2Vec

什么是 doc2vec 训练迭代？

我是 doc2vec 的新手我最初试图理解 doc2vec 下面提到的是我使用 Gensim 的代码正如我想要的那样我得到了两个文档的训练模型和文档向量但是我想知道在几个时期重新训练模型的好处以及如何在 Gensim 中做到这一点

python deeplearning Word2Vec gensim doc2vec

gensim 错误：导入错误：没有名为“gensim”的模块

我尝试导入 gensim import gensim 但出现以下错误 ImportError Traceback most recent call last

python gensim Word2Vec

gensim word2vec 访问输入/输出向量

在 word2vec 模型中有两个线性变换将词汇空间中的单词带到隐藏层 in 向量然后返回词汇空间 out 向量通常这个输出向量在训练后会被丢弃我想知道是否有一种简单的方法可以访问 gensim python 中的输出向量同样

python gensim

运行需要 gensim 旧版本的模型

我需要运行一个模型但它需要具有 DocvecsArray 属性的旧版本 gensim 我该如何运行它 AttributeError 无法在 The DocvecsArray该类已被 2018 年 2 月发布的 Gensim 3 3 0 删

python NLP gensim Word2Vec doc2vec

比较 NumPy 数组的相似性

我有一个形状为 300 的目标 NumPy 数组和一组形状也为 300 的候选数组这些数组是单词的 Word2Vec 表示我试图使用向量表示找到与目标单词最相似的候选单词找到与目标词最相似的候选词的最佳方法是什么一种方法是将目标词与

python NumPy gensim

主题分布：在python中进行LDA后如何查看哪个文档属于哪个主题

我能够运行 gensim 中的 LDA 代码并获得前 10 个主题及其各自的关键字现在我想进一步了解 LDA 算法的准确性方法是查看它们将哪些文档聚类到每个主题中这在 gensim LDA 中可能吗基本上我想做这样的事情但是在

python NLTK LDA gensim

从 Pandas DataFrame 中提取数组（列名、数据）

这是我在 Stack Overflow 上的第一个问题我有一个像这样的 Pandas 数据框 a b c d one 0 1 2 3 two 4 5 6 7 three 8 9 0 1 four 2 1 1 5 five 1 1 8 9

python pandas gensim

gensim WikiCorpus 的问题 - 将 chunkize 别名为 chunkize_serial；（__mp_main 而不是 main__？）

我对 Python 和一般编码都很陌生所以我似乎遇到了一个问题我正在尝试运行这段代码归功于马修梅奥整个事情都可以找到here https www kdnuggets com 2017 11 building wikipedia t

python python3x Windows NLP gensim

gensim word2vec - 使用在线词嵌入更新数组维度

gensim 0 13 4 1 中的 Word2Vec 无法动态更新词向量 model build vocab sentences update False 工作正常然而 model build vocab sentences updat

python NumPy gensim

python luigi 意外死亡，退出代码为 -11

我有一个数据管道luigi如果我让 1 名工人来完成这项任务效果就非常好但是如果我放置 gt 1 个工作线程那么它会在具有 2 个依赖项的阶段中死亡意外地退出代码为 11 代码相当复杂因此很难给出最小的示例问题的要点是我正在做

python textmining gensim luigi

手动将搭配添加到 gensim 短语器

我正在对语言学论文进行主题建模并使用 Gensim 短语来识别频繁的搭配我希望能够将术语 do support 和 it clefts 标记为一个单词因为它们是特定的语言术语但是如果我在取出停用词后制作 Gensim 模型则不会

gensim topicmodeling