Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
根据余弦相似度值进行聚类
我从一组 URL 中提取了单词 并计算了每个 URL 内容之间的余弦相似度 而且我还标准化了 0 1 之间的值 使用最小 最大 现在我需要根据余弦相似度值对 URL 进行聚类以查找找出类似的 URL 哪种聚类算法最合适 请建议我一种动态聚类
URL
NLP
clusteranalysis
informationretrieval
如何在 Python 中使用 K-Means 聚类找到最佳聚类数
我是聚类算法的新手 我有一个电影数据集 包含 200 多部电影和 100 多个用户 所有用户都至少评价了一部电影 值 1 表示好 0 表示坏 如果注释者别无选择 则值为空白 我想根据相似的用户的评论对他们进行聚类 这样的想法是 将相似电影评
python
clusteranalysis
kmeans
euclideandistance
cosinesimilarity
在Python中根据值的接近程度对值进行聚类(机器学习?)[重复]
这个问题在这里已经有答案了 我有一个在一组对象上运行的算法 该算法产生一个分值 该分值指示集合中元素之间的差异 排序后的输出是这样的 1 1 5 6 1 5 10 22 23 23 50 51 51 52 100 112 130 500 5
python
machinelearning
clusteranalysis
datamining
完整加权网络中的社区检测
我确实有一个完整的网络图 其中每个顶点都相互连接 它们仅在不同权重的形式上有所不同 一个示例网络是 一个贸易网络 其中每个国家都以某种方式相互连接 只是贸易量的形式不同 现在的问题是我如何以这种形式的网络执行社区检测 通常的嫌疑人 算法 只
Algorithm
NetworkProgramming
clusteranalysis
如何设置Spark Kmeans初始中心
我正在使用 Spark ML 来运行 Kmeans 我有一堆数据和三个现有中心 例如这三个中心是 1 0 1 0 1 0 5 0 5 0 5 0 9 0 9 0 9 0 那么我如何表明 Kmeans 中心是上述三个向量 我看到 Kmean
java中调用R-Rcaller
我正在尝试通过使用 R 调用程序在 java 中使用 R 来实现集群 我正在尝试运行示例代码进行聚类验证 并且遇到大多数用户面临的常见错误 文件过早结束 package test import rcaller RCaller import
Java
r
clusteranalysis
rcaller
R pheatmap:执行聚类并显示每个注释类别的树状图
我知道如何使用 pheatmap 按注释类别对行 基因 进行分组 并且我知道如何对整组行 基因 执行 Person 的相关聚类 但我想要完成的是执行聚类 并显示独立的每个类别独立的树状图 这可能吗 或者我是否被迫为每个类别创建单独的热图以在
r
clusteranalysis
Heatmap
pheatmap
使用 clusplot 绘制以 0 为中心坐标的聚类
我正在尝试绘制 GIS 坐标 特别是东向和北向相似的英国国家网格坐标 194630000 562220000 我可以使用 Cluster 库中的 clusplot 绘制这些图 clusplot df2 k means fit cluster
r
Coordinates
GIS
clusteranalysis
kmeans
如何绘制簇内簇内平方和图?
我有一个 R 的聚类图 同时我想用 wss 图优化聚类的 肘部准则 但我不知道如何为给定的聚类绘制 wss 图 有人会帮助我吗 这是我的数据 Friendly lt c 0 467 0 175 0 004 0 025 0 083 0 004
r
plot
clusteranalysis
hierarchicalclustering
在 R 中获得多种分区方法的共识
My data data cbind c 1 1 2 1 1 3 c 1 1 2 1 1 1 c 2 2 1 2 1 2 colnames data paste item 1 3 rownames data paste method 1 6
r
Algorithm
Classification
clusteranalysis
partitioning
如何根据Python中最近的聚类质心逻辑将新的观察值分配给现有的Kmeans聚类?
我使用下面的代码通过 Scikit learn 创建 k means 集群 kmean KMeans n clusters nclusters n jobs 1 random state 2376 max iter 1000 n init
python
scikitlearn
clusteranalysis
kmeans
textclassification
基于相似单词序列的字符串聚类
我正在寻找一种有效的方法 根据相似单词序列的出现将大约 1000 万个字符串聚类成簇 考虑一个字符串列表 例如 the fruit hut number one the ice cre am shop number one jim s ta
Algorithm
machinelearning
NLP
clusteranalysis
在 Python 中使用 Scipy Hierarchy Clustering 进行文本聚类
我有一个文本语料库 其中包含 1000 多篇文章 每篇文章都在单独的行中 我正在尝试使用 python 中的 Scipy 进行层次聚类来生成相关文章的集群 这是我用来进行聚类的代码 Agglomerative Clustering impo
python
scipy
clusteranalysis
textmining
如何对 NetworkX 中创建的图 g 进行聚类?
我正在尝试将聚类应用于数据集 在此之前 我必须将图划分为 n 个簇 但我不知道该怎么做 Suppose 边缘列表你的未加权的 and 不定向的 graph保存在文件edges txt中 您可以按照以下步骤对图的节点进行聚类 Step 1 g
python
clusteranalysis
networkx
Embedding
聚类数量未知的无监督聚类
我有一大组 3 维向量 我需要根据欧几里德距离对它们进行聚类 以便任何特定聚类中的所有向量彼此之间的欧几里德距离小于阈值 T 我不知道有多少个集群 最后 可能存在不属于任何簇的单独向量 因为其与空间中任何向量的欧几里德距离不小于 T 这里应
如何使用 R 中的 k 均值聚类技术获得与数据相对应的聚类编号? [关闭]
很难说出这里问的是什么 这个问题模棱两可 含糊不清 不完整 过于宽泛或言辞激烈 无法以目前的形式合理回答 如需帮助澄清此问题以便重新打开 访问帮助中心 我通过 k 均值聚类方法对数据进行聚类 如何在 R 中使用 k 均值聚类技术获得与数据相
r
clusteranalysis
kmeans
如何解决错误:storage.mode(x) <-“double”中的错误:无法强制“list”对象输入“double”
您好 我正在尝试运行 som 和 kmeans 分析 但我无法解决它 因为有一个错误代码 storage mode x 我怎么解决这个问题 cdata lt read delim Cluster txt stringsAsFactors F
r
SyntaxError
clusteranalysis
kmeans
som
有哪些实现半监督(约束)聚类的软件包?
我想对半监督 约束 聚类进行一些实验 特别是作为实例级成对约束 必须链接或无法链接约束 提供的背景知识 我想知道有没有好的开源包实现半监督聚类 我尝试查看 PyBrain mlpy scikit 和 Orange 但找不到任何约束聚类算法
clusteranalysis
kmeans
pybrain
DBSCAN
如何确定数据点的两个分区(聚类)是否相同?
I have n某个任意空间中的数据点 我将它们聚类 我的聚类算法的结果是一个由 int 向量表示的分区l长度n将每个点分配给一个簇 的价值观l范围从 0 到 可能 n 1 Example l 1 1 1 1 0 0 2 6 是一个分区n
c
python
Algorithm
MATLAB
clusteranalysis
具有非常大矩阵的 K 均值
我必须在一个非常大的矩阵 大约 300 000x100 000 个值 超过 100Gb 上执行 k 均值聚类 我想知道我是否可以使用 R 软件或 weka 来执行此操作 我的计算机是一台多处理器 具有 8GB 内存和数百 GB 可用空间 我
r
clusteranalysis
Weka
kmeans
mahout
«
1
2
3
4
5
6
7
8
»