gensim

如何在 Tensorflow 中使用预训练的 Word2Vec 模型

我有一个Word2Vec训练过的模型Gensim 我如何使用它Tensorflow for Word Embeddings 我不想在 Tensorflow 中从头开始训练嵌入有人可以告诉我如何用一些示例代码来做到这一点吗假设您有一个字典

python tensorflow gensim Word2Vec wordembedding

在 Gensim 中通过 ID 检索文档的字符串版本

我正在使用 Gensim 进行一些主题建模并且已经达到使用 LSI 和 tf idf 模型进行相似性查询的程度我取回 ID 集和相似点例如 299501 0 64505910873413086 如何获取与 ID 在本例中为 29950

python gensim

Python NLP 英式英语与美式英语

我目前正在用Python 进行NLP 工作然而在我的语料库中既有英式英语也有美式英语实现实现我正在考虑将英式英语转换为美式英语但是我没有找到一个好的工具包来做到这一点有什么建议么我也找不到包但试试这个请注意我必须

python NLP NLTK gensim linguistics

使用 Doc2vec 后如何解释 Clusters 结果？

我正在使用 doc2vec 将关注者的前 100 条推文转换为矢量表示形式例如 v1 v100 之后我使用向量表示来进行 K 均值聚类 model Doc2Vec documents t size 100 alpha 035 windo

python scikitlearn clusteranalysis gensim doc2vec

高维数据的ELKI Kmeans聚类任务失败错误

我有 60000 个文档我在其中处理过gensim得到一个60000 300的矩阵我将其导出为csv文件当我导入这个时ELKI环境和运行Kmeans聚类我遇到以下错误 Task failed de lmu ifi dbs elki

clusteranalysis kmeans gensim doc2vec elki

如何使用 python-pandas 和 gensim 将数据框中的单词映射到整数 ID？

给定这样一个数据框包括项目和相应的评论文本 item id review text B2JLCNJF16 i was attracted to this B0009VEM4U great snippers 我想绘制顶部的地图5000最常用

python pandas gensim

AttributeError：类型对象“Word2Vec”没有属性“load_word2vec_format”

我正在尝试实现 word2vec 模型并收到属性错误 AttributeError 类型对象 Word2Vec 没有属性 load word2vec format 下面是代码 wv Word2Vec load word2vec format

python NLP gensim Word2Vec

将 word2vec 模型查询的结果保存在 csv 文件中？

我正在语料库上训练 word2vec 模型然后查询该模型这工作正常但我正在运行一个实验需要针对不同的条件调用模型保存每个条件的模型查询每个条件的模型然后将查询的输出保存到 csv 文件中例如进一步分析所有条件我研究了 ge

python csv Word2Vec gensim

gensim如何计算doc2vec段落向量

我正在看这篇论文http cs stanford edu quocle paragraph vector pdf http cs stanford edu quocle paragraph vector pdf 它指出段落向量和词向量被平

NLP vectorization gensim Word2Vec doc2vec

从文本文件中提取与输入单词最相似的前 N 个单词

我有一个文本文件其中包含我使用 BeautifulSoup 提取的网页内容我需要根据给定的单词从文本文件中找到 N 个相似的单词流程如下从中提取文本的网站 https en wikipedia org wiki Football h

python deeplearning NLP spacy gensim

如何将 Pandas DataFrame 中加载的嵌入转换为 Gensim 模型？

我有一个 DataFrame 其中索引是单词并且有 100 个带有浮点数的列这样对于每个单词我将其嵌入为 100d 向量我想将我的 DataFrame 对象转换为gensim 模型对象 https radimrehurek com

python pandas gensim

将 freebase 向量与 gensim 一起使用

我正在尝试使用 Google 发布的 freebase 单词嵌入但我很难从 freebase 名称中获取单词 model gensim models Word2Vec load word2vec format freebase vecto

python freebase gensim Word2Vec

word2vec中单词的向量代表什么？

word2vec https code google com p word2vec 是 Google 的开源工具它为每个单词提供一个浮点值向量它们到底代表什么还有一篇论文关于段落向量 http cs stanford edu quoc

machinelearning NLP neuralnetwork gensim

Gensim LDA 主题分配

我希望使用 LDA 将每个文档分配给一个主题现在我意识到您得到的是 LDA 主题的分布然而正如您从下面最后一行看到的我将其分配给最有可能的主题我的问题是这样的我必须跑lda corpus 有点第二次为了获得这些主题是否有其他内

gensim LDA topicmodeling

如何将单词和向量手动添加到Word2vec gensim？

比方说 word2vec模型是我训练过的 word2vec 模型当词汇表之外的单词 oov word 发生时我计算一个向量vec using 计算向量 oov word 方法现在我想添加追加oov word及其对应的向量vec到我

gensim Word2Vec

下载gensim数据集时出现ValueError

我想下载 gensim glove wiki gigaword 100 数据集这是我的代码 import gensim downloader as api model api load glove wiki gigaword 100 但我

python gensim

使用gensim加载LdaMallet模型并对未见过的文档进行分类的正确方法

在我的项目中我使用Python库gensim https radimrehurek com gensim models wrappers ldamallet html用于主题建模文本提取我尝试加载经过训练的 LdaMallet 模型来

python gensim LDA mallet

如何在 python-gensim 中使用潜在狄利克雷分配（LDA）来抽象二元组主题而不是一元组？

LDA 原始输出一元语法主题1 水肺水蒸汽潜水主题2 二氧化物植物绿色碳所需输出二元组主题主题1 水肺潜水水蒸气主题2 绿色植物二氧化碳任何想法鉴于我有一个名为docs 包含文档中的单词列表我可以使用 n

NLP textmining LDA gensim

word2vec gensim 多种语言

这个问题完全超出了我的想象我正在使用 gensim 训练 Word2Vec 模型我提供了多种语言的数据即英语和印地语当我试图找到最接近人的词时我得到的是 model wv most similar positive man O

python NLP artificialintelligence Word2Vec gensim

如何获取与某个单词相关的相似单词？

我正在尝试解决一个 nlp 问题其中我有一个单词字典例如 list 1 phone android chair netflit charger macbook laptop sony 现在如果输入是 phone 我可以轻松地使用 in

python NLP NLTK gensim spacy