Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
为什么 Gensim doc2vec 给出 AttributeError: 'list' object has no attribute 'words'?
我正在尝试使用以下代码来实验 gensim doc2vec 据我从教程中了解到 它应该有效 然而它给出了属性错误 列表 对象没有属性 单词 from gensim models doc2vec import LabeledSentence
python3x
gensim
Word2Vec
word2vec 模型由字符而不是单词组成
我正在尝试使用 Gensim 在波斯语上制作一个 word2vec 模型 其中以 空格 作为字符分隔符 我使用 python 3 5 我遇到的问题是我给出了一个文本文件作为输入 它返回一个模型 该模型仅包含每个字符而不是单词 我还以推荐的单
gensim
Word2Vec
加载 word2vec 时出现 UnicodeDecodeError 错误
详细描述 我开始使用词嵌入 并发现了大量有关它的信息 到目前为止 我知道我可以训练自己的词向量或使用以前训练过的词向量 例如 Google 或 Wikipedia 的词向量 这些向量可用于英语 但对我来说没有用 因为我正在处理以下语言中的文
python
Word2Vec
gensim
pythonunicode
polyglot
gensim 的 get_document_topics 方法返回的概率加起来不等于 1
有时它返回所有主题的概率并且一切都很好 但有时它只返回几个主题的概率并且它们加起来不等于一 似乎这取决于文档 一般来说 当它返回很少的主题时 概率加起来大约为 80 那么它只返回最相关的主题吗 有没有办法强制它返回所有概率 也许我遗漏了一些
textmining
gensim
LDA
topicmodeling
每次我在同一语料库上训练时,LDA 模型都会生成不同的主题
我正在使用Pythongensim从包含 231 个句子的小语料库中训练潜在狄利克雷分配 LDA 模型 然而 每次我重复这个过程 它都会产生不同的主题 为什么相同的LDA参数和语料每次生成不同的主题 如何稳定话题生成 我正在使用这个语料库
python
NLP
LDA
topicmodeling
gensim
我正在使用 Word2Vec 和 gensim 在 python 中出现“__init__() 获得意外的关键字参数'文档'”此错误
我正在使用 Word2vec 和 gensim 进行项目 model gensim models Word2Vec documents userDataFile txt size 150 window 10 min count 2 work
python
gensim
Word2Vec
LDA Mallet 调用进程错误
我正在尝试实现以下代码 import os os environ update MALLET HOME r c mallet 2 0 8 mallet path C mallet 2 0 8 bin mallet ldamallet gen
python3x
gensim
LDA
mallet
在 Tensorboard 投影仪中可视化 Gensim Word2vec 嵌入
我只看到了几个提出这个问题的问题 但没有一个有答案 所以我想我不妨尝试一下 我一直在使用 gensim 的 word2vec 模型来创建一些向量 我将它们导出为文本 并尝试将其导入到嵌入投影仪的张量流实时模型中 一个问题 没用 它告诉我张量
python
tensorflow
gensim
tensorboard
wordembedding
使用 t-sne 可视化从 gensim 生成的 word2vec
我使用 gensim 在我自己的语料库上训练了 doc2vec 和相应的 word2vec 我想使用 t sne 和单词来可视化 word2vec 如图所示 图中的每个点也带有 单词 我在这里看了一个类似的问题 word2vec 上的 t
scikitlearn
datavisualization
gensim
Word2Vec
什么是 doc2vec 训练迭代?
我是 doc2vec 的新手 我最初试图理解 doc2vec 下面提到的是我使用 Gensim 的代码 正如我想要的那样 我得到了两个文档的训练模型和文档向量 但是 我想知道在几个时期重新训练模型的好处以及如何在 Gensim 中做到这一点
python
deeplearning
Word2Vec
gensim
doc2vec
gensim 错误:导入错误:没有名为“gensim”的模块
我尝试导入 gensim import gensim 但出现以下错误 ImportError Traceback most recent call last
python
gensim
Word2Vec
gensim word2vec 访问输入/输出向量
在 word2vec 模型中 有两个线性变换 将词汇空间中的单词带到隐藏层 in 向量 然后返回词汇空间 out 向量 通常这个输出向量在训练后会被丢弃 我想知道是否有一种简单的方法可以访问 gensim python 中的输出向量 同样
python
gensim
运行需要 gensim 旧版本的模型
我需要运行一个模型 但它需要具有 DocvecsArray 属性的旧版本 gensim 我该如何运行它 AttributeError 无法在 The DocvecsArray该类已被 2018 年 2 月发布的 Gensim 3 3 0 删
python
NLP
gensim
Word2Vec
doc2vec
比较 NumPy 数组的相似性
我有一个形状为 300 的目标 NumPy 数组和一组形状也为 300 的候选数组 这些数组是单词的 Word2Vec 表示 我试图使用向量表示找到与目标单词最相似的候选单词 找到与目标词最相似的候选词的最佳方法是什么 一种方法是将目标词与
python
NumPy
gensim
主题分布:在python中进行LDA后如何查看哪个文档属于哪个主题
我能够运行 gensim 中的 LDA 代码 并获得前 10 个主题及其各自的关键字 现在 我想进一步了解 LDA 算法的准确性 方法是查看它们将哪些文档聚类到每个主题中 这在 gensim LDA 中可能吗 基本上我想做这样的事情 但是在
python
NLTK
LDA
gensim
从 Pandas DataFrame 中提取数组(列名、数据)
这是我在 Stack Overflow 上的第一个问题 我有一个像这样的 Pandas 数据框 a b c d one 0 1 2 3 two 4 5 6 7 three 8 9 0 1 four 2 1 1 5 five 1 1 8 9
python
pandas
gensim
gensim WikiCorpus 的问题 - 将 chunkize 别名为 chunkize_serial; (__mp_main__ 而不是 __main__?)
我对 Python 和一般编码都很陌生 所以我似乎遇到了一个问题 我正在尝试运行这段代码 归功于马修 梅奥 整个事情都可以找到here https www kdnuggets com 2017 11 building wikipedia t
python
python3x
Windows
NLP
gensim
gensim word2vec - 使用在线词嵌入更新数组维度
gensim 0 13 4 1 中的 Word2Vec 无法动态更新词向量 model build vocab sentences update False 工作正常 然而 model build vocab sentences updat
python
NumPy
gensim
python luigi 意外死亡,退出代码为 -11
我有一个数据管道luigi如果我让 1 名工人来完成这项任务 效果就非常好 但是 如果我放置 gt 1 个工作线程 那么它会在具有 2 个依赖项的阶段中死亡 意外地退出代码为 11 代码相当复杂 因此很难给出最小的示例 问题的要点是我正在做
python
textmining
gensim
luigi
手动将搭配添加到 gensim 短语器
我正在对语言学论文进行主题建模 并使用 Gensim 短语来识别频繁的搭配 我希望能够将术语 do support 和 it clefts 标记为一个单词 因为它们是特定的语言术语 但是 如果我在取出停用词后制作 Gensim 模型 则不会
gensim
topicmodeling
«
1
2
3
4
5
»