Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
如何使用 NLP 将非结构化文本内容分成不同的段落?
以下非结构化文本具有三个不同的主题 史泰龙 费城和美国革命 但是您会使用哪种算法或技术将这些内容分成不同的段落 分类器在这种情况下不起作用 我还尝试使用 Jaccard 相似度分析器来查找连续句子之间的距离 并尝试在连续句子之间的距离小于给
Text
NLP
Classification
clusteranalysis
textsegmentation
如何在R编程中显示同一坐标中的总数
更新2017年9月11日问题 这是我在 R 中集群 kmode 的代码 library klaR setwd D kmodes data to cluster lt read csv kmodes csv header TRUE sep c
r
clustercomputing
clusteranalysis
kmeans
visualize
在 R 中,如何在对数据进行聚类后绘制相似度矩阵(如框图)?
我想生成一个图表 显示聚类数据和相似度矩阵之间的相关性 我怎样才能在 R 中做到这一点 R 中是否有任何函数可以创建像此链接中的图片一样的图形 http bp0 blogger com VCI4AaOLs A SG5H jm f8I AAA
r
clusteranalysis
Java集群库[关闭]
Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我正在寻找java中的轻量级聚类库 我不需要该库中的 100 个聚类算法 只需 5 到 7 个算法就可以
Java
Math
clusteranalysis
余弦距离作为 k 均值的向量距离函数
我有一个 N 个顶点的图 其中每个顶点代表一个地方 我还有向量 每个用户一个 N 个系数中的每一个 其中系数的值是在相应地点花费的持续时间 以秒为单位 如果没有访问该地点则为 0 例如 对于图表 向量 v1 100 50 0 30 0 意味
clusteranalysis
datamining
Distance
kmeans
cosinesimilarity
当数据形状为(x,y,z)时如何进行聚类?
假设我有 10 个单独的观测值 每个观测值的大小为 125 59 我想根据这 10 个观测值的 2d 特征矩阵 125 59 对它们进行分组 这是否可以在不将每个观测值展平为 125 59 1D 矩阵的情况下实现 我什至无法实现 PCA 或
K-Medoids 真的比 K-Means 更擅长处理异常值吗? (举例说明相反)
K 中心点 and K Means是两种流行的分区聚类方法 我的研究表明 当存在异常值时 K Medoids 更擅长对数据进行聚类 source https stackoverflow com questions 21619794 what
r
clusteranalysis
partitioning
kmeans
使用elasticsearch进行文档聚类的便捷方法是什么?
我在 Elasticsearch 索引中存储了来自不同来源的 RSS 提要的大量新闻文章 当我进行搜索查询时 一次查询就会返回很多类似的新闻文章 因为相同的新闻主题会被许多 RSS 源覆盖 相反 我想做的是仅返回同一主题的一组文章中的一篇新
Algorithm
elasticsearch
clusteranalysis
寻找集体智慧.Net / C# 资源 [关闭]
Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 首先 我意识到这是一个与此非常相似的问题 net java 中有哪些优秀的集体智能开源库 https
c
NET
Algorithm
clusteranalysis
collectiveintelligence
使用 sklearn 对单变量时间序列进行聚类
我有一个 panda DataFrame 我想从中对每一列进行聚类 我正在使用 sklearn 这就是我所拥有的 data pd read csv data csv data pd DataFrame data data data set
python
pandas
machinelearning
scikitlearn
clusteranalysis
快速 (< n^2) 聚类算法
我有 100 万个 5 维点 需要将它们分组为 k 个簇 其中 k 但 我需要运行时间远低于 n 2 n log n 左右应该没问题 我进行此聚类的原因是为了避免计算所有 n 个点的距离矩阵 这需要 n 2 时间或多个小时 而是我只想计算聚
Algorithm
machinelearning
clusteranalysis
datamining
kmeans
如何使用相关系数矩阵进行聚类?
我有一个相关系数矩阵 n n 如何利用相关系数矩阵进行聚类 我可以在 SciPy 中使用链接和 fcluster 函数吗 联动功能需求n m矩阵 根据教程 但我想使用 n n 矩阵 我的代码是 corre mp N corr mp N is
python
scipy
clusteranalysis
correlation
Linkage
决定倒塌这棵树的截止的算法?
我有一个Newick http en wikipedia org wiki Newick format通过比较 4 9 bp 长 DNA 序列的假定 DNA 调控基序的位置权重矩阵 PWM 或 PSSM 的相似性 欧几里德距离 而构建的树
python
statistics
clusteranalysis
Bioinformatics
在自定义对象上使用 ELKI 并理解结果
我正在尝试使用ELKI的SLINK实现我的程序中的层次聚类 我有一组需要聚类的对象 属于我自己的类型 为此 我在聚类之前将它们转换为特征向量 这就是我目前让它运行并产生一些结果的方式 代码在 Scala 中 val clusterer ne
clusteranalysis
hierarchicalclustering
elki
玩具图聚类中“ufactor”的解释
我正在尝试通过 METIS 进行不平衡分区 我不需要每个簇中有相同数量的顶点 METIS 中默认这样做 我的图没有约束 它是一个无向未加权图 这是一个由 METIS 聚类的示例玩具图 没有ufactor范围 然后 我尝试用不同的ufacto
clusteranalysis
metis
对一维数据使用什么聚类算法? [关闭]
很难说出这里问的是什么 这个问题是含糊的 模糊的 不完整的 过于宽泛的或修辞性的 无法以目前的形式得到合理的回答 如需帮助澄清此问题以便重新打开 访问帮助中心 我有一个数组中的数字列表 每个元素的索引是 X 值是 Y 我如何对这些数据进行分
python
clusteranalysis
具有相同簇大小的 K 均值算法变体
我正在寻找最快的算法 用于按距离将地图上的点分组为大小相等的组 这k 均值聚类算法看起来简单且有前途 但不能产生同等规模的群体 该算法是否有一种变体 或者是否有一种不同的算法可以允许所有集群的成员数量相等 也可以看看 将 n 个点分组到 k
Algorithm
Dictionary
clusteranalysis
kmeans
R中Leaflet中聚集标记的聚合加权线串
我正在尝试绘制位置和加权连接线串 当我放大或缩小时 标记的聚类会调整得很好 显示的集群标签是聚合的node val的标记 我想对线串做类似的事情 这样 该图不显示连接单个标记的蓝线 而是显示连接标记簇的线 并且 连接标记簇的新线串的宽度根据
r
leaflet
clusteranalysis
rsf
使用 WEKA API 定义聚类的输入数据
我想对由纬度和经度指定的点进行聚类 我在用WEKA API问题在于Instances instances new Instances 40 01 1 02 那么 如何在不使用 ARFF 文件的情况下指定输入数据呢 我只想将数组读入Insta
Java
API
clusteranalysis
Weka
使用现有列的树状图的颜色分支
我有一个正在尝试聚类的数据框 我在用hclust现在 在我的数据框中 有一个FLAG我想为树状图着色的列 通过生成的图片 我试图找出各种之间的相似之处FLAG类别 我的数据框看起来像这样 FLAG ColA ColB ColC ColD 我
r
clusteranalysis
hierarchicalclustering
dendrogram
dendextend
«
1
2
3
4
5
6
7
8
»