Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
如何在 Tensorflow 中使用预训练的 Word2Vec 模型
我有一个Word2Vec训练过的模型Gensim 我如何使用它Tensorflow for Word Embeddings 我不想在 Tensorflow 中从头开始训练嵌入 有人可以告诉我如何用一些示例代码来做到这一点吗 假设您有一个字典
python
tensorflow
gensim
Word2Vec
wordembedding
在 Gensim 中通过 ID 检索文档的字符串版本
我正在使用 Gensim 进行一些主题建模 并且已经达到使用 LSI 和 tf idf 模型进行相似性查询的程度 我取回 ID 集和相似点 例如 299501 0 64505910873413086 如何获取与 ID 在本例中为 29950
python
gensim
Python NLP 英式英语与美式英语
我目前正在用Python 进行NLP 工作 然而 在我的语料库中 既有英式英语也有美式英语 实现 实现 我正在考虑将英式英语转换为美式英语 但是 我没有找到一个好的工具 包来做到这一点 有什么建议么 我也找不到包 但试试这个 请注意 我必须
python
NLP
NLTK
gensim
linguistics
使用 Doc2vec 后如何解释 Clusters 结果?
我正在使用 doc2vec 将关注者的前 100 条推文转换为矢量表示形式 例如 v1 v100 之后 我使用向量表示来进行 K 均值聚类 model Doc2Vec documents t size 100 alpha 035 windo
python
scikitlearn
clusteranalysis
gensim
doc2vec
高维数据的ELKI Kmeans聚类任务失败错误
我有 60000 个文档 我在其中处理过gensim得到一个60000 300的矩阵 我将其导出为csv文件 当我导入这个时ELKI环境和运行Kmeans聚类 我遇到以下错误 Task failed de lmu ifi dbs elki
clusteranalysis
kmeans
gensim
doc2vec
elki
如何使用 python-pandas 和 gensim 将数据框中的单词映射到整数 ID?
给定这样一个数据框 包括项目和相应的评论文本 item id review text B2JLCNJF16 i was attracted to this B0009VEM4U great snippers 我想绘制顶部的地图5000最常用
python
pandas
gensim
AttributeError:类型对象“Word2Vec”没有属性“load_word2vec_format”
我正在尝试实现 word2vec 模型并收到属性错误 AttributeError 类型对象 Word2Vec 没有属性 load word2vec format 下面是代码 wv Word2Vec load word2vec format
python
NLP
gensim
Word2Vec
将 word2vec 模型查询的结果保存在 csv 文件中?
我正在语料库上训练 word2vec 模型 然后查询该模型 这工作正常 但我正在运行一个实验 需要针对不同的条件调用模型 保存每个条件的模型 查询每个条件的模型 然后将查询的输出保存到 csv 文件中 例如进一步分析所有条件 我研究了 ge
python
csv
Word2Vec
gensim
gensim如何计算doc2vec段落向量
我正在看这篇论文http cs stanford edu quocle paragraph vector pdf http cs stanford edu quocle paragraph vector pdf 它指出 段落向量和词向量被平
NLP
vectorization
gensim
Word2Vec
doc2vec
从文本文件中提取与输入单词最相似的前 N 个单词
我有一个文本文件 其中包含我使用 BeautifulSoup 提取的网页内容 我需要根据给定的单词从文本文件中找到 N 个相似的单词 流程如下 从中提取文本的网站 https en wikipedia org wiki Football h
python
deeplearning
NLP
spacy
gensim
如何将 Pandas DataFrame 中加载的嵌入转换为 Gensim 模型?
我有一个 DataFrame 其中索引是单词 并且有 100 个带有浮点数的列 这样对于每个单词 我将其嵌入为 100d 向量 我想将我的 DataFrame 对象转换为gensim 模型对象 https radimrehurek com
python
pandas
gensim
将 freebase 向量与 gensim 一起使用
我正在尝试使用 Google 发布的 freebase 单词嵌入 但我很难从 freebase 名称中获取单词 model gensim models Word2Vec load word2vec format freebase vecto
python
freebase
gensim
Word2Vec
word2vec中单词的向量代表什么?
word2vec https code google com p word2vec 是 Google 的开源工具 它为每个单词提供一个浮点值向量 它们到底代表什么 还有一篇论文关于段落向量 http cs stanford edu quoc
machinelearning
NLP
neuralnetwork
gensim
Gensim LDA 主题分配
我希望使用 LDA 将每个文档分配给一个主题 现在我意识到您得到的是 LDA 主题的分布 然而 正如您从下面最后一行看到的 我将其分配给最有可能的主题 我的问题是这样的 我必须跑lda corpus 有点第二次为了获得这些主题 是否有其他内
gensim
LDA
topicmodeling
如何将单词和向量手动添加到Word2vec gensim?
比方说 word2vec模型是我训练过的 word2vec 模型 当词汇表之外的单词 oov word 发生时 我计算一个向量vec using 计算向量 oov word 方法 现在 我想添加 追加oov word及其对应的向量vec到我
gensim
Word2Vec
下载gensim数据集时出现ValueError
我想下载 gensim glove wiki gigaword 100 数据集 这是我的代码 import gensim downloader as api model api load glove wiki gigaword 100 但我
python
gensim
使用gensim加载LdaMallet模型并对未见过的文档进行分类的正确方法
在我的项目中 我使用Python库gensim https radimrehurek com gensim models wrappers ldamallet html用于主题建模 文本提取 我尝试加载经过训练的 LdaMallet 模型来
python
gensim
LDA
mallet
如何在 python-gensim 中使用潜在狄利克雷分配(LDA)来抽象二元组主题而不是一元组?
LDA 原始输出 一元语法 主题1 水肺 水 蒸汽 潜水 主题2 二氧化物 植物 绿色 碳 所需输出 二元组主题 主题1 水肺潜水 水蒸气 主题2 绿色植物 二氧化碳 任何想法 鉴于我有一个名为docs 包含文档中的单词列表 我可以使用 n
NLP
textmining
LDA
gensim
word2vec gensim 多种语言
这个问题完全超出了我的想象 我正在使用 gensim 训练 Word2Vec 模型 我提供了多种语言的数据 即英语和印地语 当我试图找到最接近 人 的词时 我得到的是 model wv most similar positive man O
python
NLP
artificialintelligence
Word2Vec
gensim
如何获取与某个单词相关的相似单词?
我正在尝试解决一个 nlp 问题 其中我有一个单词字典 例如 list 1 phone android chair netflit charger macbook laptop sony 现在 如果输入是 phone 我可以轻松地使用 in
python
NLP
NLTK
gensim
spacy
1
2
3
4
5
»