clusteranalysis

如何使用 NLP 将非结构化文本内容分成不同的段落？

以下非结构化文本具有三个不同的主题史泰龙费城和美国革命但是您会使用哪种算法或技术将这些内容分成不同的段落分类器在这种情况下不起作用我还尝试使用 Jaccard 相似度分析器来查找连续句子之间的距离并尝试在连续句子之间的距离小于给

Text NLP Classification clusteranalysis textsegmentation

如何在R编程中显示同一坐标中的总数

更新2017年9月11日问题这是我在 R 中集群 kmode 的代码 library klaR setwd D kmodes data to cluster lt read csv kmodes csv header TRUE sep c

r clustercomputing clusteranalysis kmeans visualize

在 R 中，如何在对数据进行聚类后绘制相似度矩阵（如框图）？

我想生成一个图表显示聚类数据和相似度矩阵之间的相关性我怎样才能在 R 中做到这一点 R 中是否有任何函数可以创建像此链接中的图片一样的图形 http bp0 blogger com VCI4AaOLs A SG5H jm f8I AAA

r clusteranalysis

Java集群库[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找java中的轻量级聚类库我不需要该库中的 100 个聚类算法只需 5 到 7 个算法就可以

Java Math clusteranalysis

余弦距离作为 k 均值的向量距离函数

我有一个 N 个顶点的图其中每个顶点代表一个地方我还有向量每个用户一个 N 个系数中的每一个其中系数的值是在相应地点花费的持续时间以秒为单位如果没有访问该地点则为 0 例如对于图表向量 v1 100 50 0 30 0 意味

clusteranalysis datamining Distance kmeans cosinesimilarity

当数据形状为(x,y,z)时如何进行聚类？

假设我有 10 个单独的观测值每个观测值的大小为 125 59 我想根据这 10 个观测值的 2d 特征矩阵 125 59 对它们进行分组这是否可以在不将每个观测值展平为 125 59 1D 矩阵的情况下实现我什至无法实现 PCA 或

K-Medoids 真的比 K-Means 更擅长处理异常值吗？（举例说明相反）

K 中心点 and K Means是两种流行的分区聚类方法我的研究表明当存在异常值时 K Medoids 更擅长对数据进行聚类 source https stackoverflow com questions 21619794 what

r clusteranalysis partitioning kmeans

使用elasticsearch进行文档聚类的便捷方法是什么？

我在 Elasticsearch 索引中存储了来自不同来源的 RSS 提要的大量新闻文章当我进行搜索查询时一次查询就会返回很多类似的新闻文章因为相同的新闻主题会被许多 RSS 源覆盖相反我想做的是仅返回同一主题的一组文章中的一篇新

Algorithm elasticsearch clusteranalysis

寻找集体智慧.Net / C# 资源 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案首先我意识到这是一个与此非常相似的问题 net java 中有哪些优秀的集体智能开源库 https

c NET Algorithm clusteranalysis collectiveintelligence

使用 sklearn 对单变量时间序列进行聚类

我有一个 panda DataFrame 我想从中对每一列进行聚类我正在使用 sklearn 这就是我所拥有的 data pd read csv data csv data pd DataFrame data data data set

python pandas machinelearning scikitlearn clusteranalysis

快速 (< n^2) 聚类算法

我有 100 万个 5 维点需要将它们分组为 k 个簇其中 k 但我需要运行时间远低于 n 2 n log n 左右应该没问题我进行此聚类的原因是为了避免计算所有 n 个点的距离矩阵这需要 n 2 时间或多个小时而是我只想计算聚

Algorithm machinelearning clusteranalysis datamining kmeans

如何使用相关系数矩阵进行聚类？

我有一个相关系数矩阵 n n 如何利用相关系数矩阵进行聚类我可以在 SciPy 中使用链接和 fcluster 函数吗联动功能需求n m矩阵根据教程但我想使用 n n 矩阵我的代码是 corre mp N corr mp N is

python scipy clusteranalysis correlation Linkage

决定倒塌这棵树的截止的算法？

我有一个Newick http en wikipedia org wiki Newick format通过比较 4 9 bp 长 DNA 序列的假定 DNA 调控基序的位置权重矩阵 PWM 或 PSSM 的相似性欧几里德距离而构建的树

python statistics clusteranalysis Bioinformatics

在自定义对象上使用 ELKI 并理解结果

我正在尝试使用ELKI的SLINK实现我的程序中的层次聚类我有一组需要聚类的对象属于我自己的类型为此我在聚类之前将它们转换为特征向量这就是我目前让它运行并产生一些结果的方式代码在 Scala 中 val clusterer ne

clusteranalysis hierarchicalclustering elki

玩具图聚类中“ufactor”的解释

我正在尝试通过 METIS 进行不平衡分区我不需要每个簇中有相同数量的顶点 METIS 中默认这样做我的图没有约束它是一个无向未加权图这是一个由 METIS 聚类的示例玩具图没有ufactor范围然后我尝试用不同的ufacto

clusteranalysis metis

对一维数据使用什么聚类算法？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心我有一个数组中的数字列表每个元素的索引是 X 值是 Y 我如何对这些数据进行分

python clusteranalysis

具有相同簇大小的 K 均值算法变体

我正在寻找最快的算法用于按距离将地图上的点分组为大小相等的组这k 均值聚类算法看起来简单且有前途但不能产生同等规模的群体该算法是否有一种变体或者是否有一种不同的算法可以允许所有集群的成员数量相等也可以看看将 n 个点分组到 k

Algorithm Dictionary clusteranalysis kmeans

R中Leaflet中聚集标记的聚合加权线串

我正在尝试绘制位置和加权连接线串当我放大或缩小时标记的聚类会调整得很好显示的集群标签是聚合的node val的标记我想对线串做类似的事情这样该图不显示连接单个标记的蓝线而是显示连接标记簇的线并且连接标记簇的新线串的宽度根据

r leaflet clusteranalysis rsf

使用 WEKA API 定义聚类的输入数据

我想对由纬度和经度指定的点进行聚类我在用WEKA API问题在于Instances instances new Instances 40 01 1 02 那么如何在不使用 ARFF 文件的情况下指定输入数据呢我只想将数组读入Insta

Java API clusteranalysis Weka

使用现有列的树状图的颜色分支

我有一个正在尝试聚类的数据框我在用hclust现在在我的数据框中有一个FLAG我想为树状图着色的列通过生成的图片我试图找出各种之间的相似之处FLAG类别我的数据框看起来像这样 FLAG ColA ColB ColC ColD 我

r clusteranalysis hierarchicalclustering dendrogram dendextend