在自定义对象上使用 ELKI 并理解结果

2023-12-15

我正在尝试使用ELKI的SLINK实现我的程序中的层次聚类。

我有一组需要聚类的对象(属于我自己的类型)。为此,我在聚类之前将它们转换为特征向量。

这就是我目前让它运行并产生一些结果的方式(代码在 Scala 中):

val clusterer = new SLINK(CosineDistanceFunction.STATIC, 3)
val connection = new ArrayAdapterDatabaseConnection(featureVectors)
val database = new StaticArrayDatabase(connection, null)
database.initialize()

val result = clusterer.run(database).asInstanceOf[Clustering[_ <: Model]]

现在,结果是一个Clustering包含类型元素Model。我可以输出它们,但我不知道如何理解这个结果,特别是因为SLINK返回类型的模型DendrogramModel这似乎不可参数化。

具体来说,如何将结果链接回我的原始元素(我从中创建变量的元素)featureVectors较早)?

我假设我需要创建某种自定义模型,或者以某种方式通过初始化和执行算法来维护与原始元素的链接以从结果中检索。但我找不到从哪里开始。

我知道不鼓励将 ELKI 嵌入到自己的程序中。然而,似乎以其他方式调用 ELKI 不会有任何不同:我需要在程序运行时将结果聚类并映射回我的对象​​。


The DendrogramModel不包括簇中的对象。型号是额外的meta集群上的数据。

Use the getIDs()访问 a 的成员的方法Cluster实例。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在自定义对象上使用 ELKI 并理解结果 的相关文章

  • scikit-learn 中是否有可用的子空间聚类包

    scikit learn 中是否有任何类型的子空间聚类包可用 如果有人还有兴趣的话 是的 有一个使用 scikit learn 子空间聚类 https github com ChongYou subspace clustering 它是用于
  • ELKI:在 Java 中的自定义对象上运行 DBSCAN

    我正在尝试在 JAVA 中使用 ELKI 来运行 DBSCAN 为了进行测试 我使用了 FileBasedDatabaseConnection 现在我想使用我的自定义对象作为参数来运行 DBSCAN 我的对象具有以下结构 public cl
  • 对一维数据进行最佳聚类? [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 有没有人有一篇论文解释如何CKmeans 1d dp http cran r project org
  • 关联词的邻近度

    假设我有一段大约一段时间的对话文本记录 1小时 我想知道哪些词彼此相邻 我将使用什么类型的统计技术来确定哪些单词聚集在一起以及它们彼此之间的接近程度如何 我怀疑某种聚类分析或主成分分析 要确定单词的邻近度 您必须构建一个图表 每个单词都是一
  • R中按距离聚类

    我有一个整数向量 我希望将其分成簇 以便任何两个簇之间的距离大于下限 并且在任何簇内 两个元素之间的距离小于上限 例如 假设我们有以下向量 1 4 5 6 9 29 32 36 并将上述下界和上限分别设置为 19 和 9 下面的两个向量应该
  • 如何在自组织图中关联回原始数据点

    我正在使用 R kohonen 包来实现 SOM 我发现将自组织映射产生的代码向量与原始数据点相关联时遇到麻烦 我尝试在训练过程中包含没有权重的标签 但结果令人难以理解 有没有办法在训练过程完成后从每个节点引用原始数据点 您将从中获得中心值
  • 聚类和贝叶斯分类器 Matlab

    因此 我正处于下一步该做什么的十字路口 我开始学习一些机器学习算法并将其应用于复杂的数据集 现在我已经做到了 我从一开始的计划就是结合两种可能的分类器 试图建立一个多分类系统 但这就是我被困住的地方 我选择聚类算法 模糊 C 均值 在学习了
  • 计算 3D 平面的 Voronoi 图

    是否有代码 库可以计算 3D 平面 平行四边形 的 Voronoi 图 我检查了 Qhull 它似乎只能处理点 在它的示例中 Voro 可以处理不同大小的球体 但我找不到任何多边形 在这张图片中 3d 中的样本平面 https i stac
  • 在散点图中为每个类别绘制不同的聚类标记

    我有一个散点图 其中绘制了 14 个簇 但每 2 个簇属于同一类 它们都使用相同的标记 每 50 行是一个簇 每 100 行是同一类的两个簇 我想要做的是更改每 2 个簇或 100 行的标记 数据框链接 http www mediafire
  • scikit-learn 中聚类超参数评估的网格搜索

    我正在对大约 100 条记录 未标记 的样本进行聚类 并尝试使用 grid search 来评估具有各种超参数的聚类算法 我正在使用得分silhouette score效果很好 我的问题是我不需要使用交叉验证方面GridSearchCV R
  • python scikit-learn 缺失数据聚类

    我想对缺少列的数据进行聚类 手动执行此操作 我将在没有此列的情况下计算缺少列的距离 使用 scikit learn 不可能出现丢失数据的情况 也没有机会指定用户距离函数 是否有机会对缺失数据进行聚类 示例数据 n samples 1500
  • 距离矩阵的并行构造

    我对大量多维向量进行层次凝聚聚类 我注意到最大的瓶颈是距离矩阵的构造 此任务的简单实现如下 此处使用 Python v an array N d where rows are the observations and columns the
  • 使用 scikit learn 对通过 networkx 生成的图进行谱聚类

    我有一个 3000x50 特征向量矩阵 我使用以下方法获得了一个相似度矩阵sklearn metrics pairwise distances作为 相似度矩阵 现在我用了networkx使用上一步中生成的相似度矩阵创建一个图G nx fro
  • 有效地将相似的数字分组在一起[重复]

    这个问题在这里已经有答案了 可能的重复 一维数数组聚类 https stackoverflow com questions 11513484 1d number array clustering 我有一个数字数组 例如 1 20 300 4
  • Javascript 中的 k 均值聚类实现? [关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我需要 k means 聚类算法的 Javascript 实现 我只有一维数据 很少超过 100 个项目
  • 使用 scikit 包在 Python 中绘制集群区域的边界

    这是我处理 3 个属性 x y 值 中的数据聚类的简单示例 每个样本代表其位置 x y 及其所属变量 我的代码发布在这里 x np arange 100 200 1 y np arange 100 200 1 value np random
  • 哪里可以找到可靠的 K-medoid(不是 k-means)开源软件/工具? [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我正在学习 K medoids 算法 所以如果我提出不恰当的问题 我很抱歉 据我所知 K medoid
  • KMeans 对不平衡数据进行聚类

    我有一组包含 50 个特征 c1 c2 c3 的数据 行数超过 80k 每行包含标准化数值 范围 0 1 它实际上是一个标准化的虚拟变量 其中一些行只有很少的特征 3 4 即如果没有值则分配 0 大多数行大约有 10 20 个特征 我使用
  • 寻找簇的中心

    我有以下问题 进行抽象以找出关键问题 我有 10 个点 每个点与其他点有一定距离 我想要 能够找到簇的中心 即与其他点的成对距离最小的点 令 p j p k 表示点 j 和 k 之间的成对距离p i 是簇的中心点 iff p i s t m
  • 使用 Doc2vec 后如何解释 Clusters 结果?

    我正在使用 doc2vec 将关注者的前 100 条推文转换为矢量表示形式 例如 v1 v100 之后 我使用向量表示来进行 K 均值聚类 model Doc2Vec documents t size 100 alpha 035 windo

随机推荐

  • @property 和 @synthesize 在 Objective-C 中的用途是什么?

    有什么用 财产 and 合成 您能举个例子解释一下吗 非常简短的答案 他们为 ivars 创建访问器 有维基百科上的一些例子 看看那些
  • Matlab:是否有一个函数可以定位数字中的“n”位(即“75673”中的第二位数字,所以5)

    我有一个号码A 7654321 我需要位置 5 处的数字 从开头算起 或从末尾算起的数字 3 在本例中为 3 是否有一个函数可以执行以下操作 getdigit A n 其中 A 是数字 n 是我想要的数字的位置 我可以将数字转换为文本字符串
  • 仍然无法理解 ASP.NET 事件。他们有什么意义?

    也许我很慢 但我只是不明白为什么你会使用不是从实际操作 例如单击 派生的事件 当您只需调用方法时 为什么要经历创建委托和事件的繁琐工作呢 看起来 当您创建一个事件时 您所做的只是创建一种方法 让调用者通过一些复杂的过程来调用一个简单的方法
  • 如何将 ASP.NET 下拉列表 DataTextField 属性绑定到嵌套属性

    我想绑定DataTextFieldASP NET 下拉控件的属性到作为初始数据源的属性的对象的属性 我将如何完成这项特定任务 下拉数据源数据架构 public class A public string ID get set public
  • ajax请求后页面刷新

    好吧 我有一个简单的表格 仅包含一个text field 当我们点击提交时 写入文本字段的数据将存储在数据库中 通过ajax存储 ajax 工作正常并且数据已提交 但是页面会自动刷新并且 URL 包含输入字段的内容 我的表格
  • 我应该使用多个数据库吗?

    我即将使用 Ruby on Rails 创建一个应用程序 我想使用多个数据库 基本上是一个会计应用程序 每个用户都有多个公司 我想为每个公司创建一个数据库 我找到了这个帖子http programmerassist com article
  • Fiware - 上下文代理:NGSIv2 订阅问题

    我正在使用 Orion 上下文代理版本 1 2 0 我使用 NGSIv2 订阅了两个不同的 cygnus 0 11 和 0 13 如下 curl 172 21 0 23 1026 v2 subscriptions s S header Fi
  • 查找重复的图像文件

    我的硬盘中存储了大约 1 TB 的图像 这些是朋友和家人长时间拍摄的照片 从某种意义上说 这些图片中的许多都是重复的 相同的文件保存在不同的位置 可能也具有不同的名称 我想问是否有任何工具 实用程序或方法 我可以编写一个 来找出重复的文件
  • 如何使 rush 与我的 orionInstance 一起工作

    按照我之前的问题如何在 MapViewer 小部件中显示来自 OrionContextBroker 的实体我使用 Rush 配置了我的上下文代理实例 并且正在使用https ngsiproxy lab fi ware org作为 NGSI
  • 如何使用java并发编程的ExecutorService?

    我使用下面的代码在远程服务器上上传图像 当我使用下面的代码时 它会同时在远程服务器上上传所有图像 List
  • 排序功能未按预期工作

    我有一个对象数组 实际上是从后端获取的 现在我正在映射数据 并希望通过单击按钮按升序和降序对其进行排序 所以我创建了一个 onSort 函数 但它不起作用我预计 因为大写和小写问题存在 即使按字母顺序排列 最后显示小写 数字没有排序 还有另
  • 如何在单元格选择/取消选择时正确切换 UITableViewCellaccessoryType?

    我正在尝试切换配件类型当选择 取消选择表格单元格时 行为应该是 点击 gt 将accessoryType 设置为UITableViewCellAccessory复选标记 gt 再次点击单元格 gt 回滚到UITableViewCell 附件
  • .NET 4.5 SslStream - 取消异步读/写调用?

    有没有办法取消 SslStream 上的异步读取或写入任务 我尝试为 ReadAsync 提供 CancellationToken 但它似乎不起作用 当以下代码达到超时 Task Delay 时 它会调用 CancellationToken
  • 为 python 2 和 python 3 安装 scipy

    I used sudo apt get install python scipy安装 scipy 这将所有文件放入 usr lib python2 7 dist packages scipy 我最好的猜测是它选择该位置是因为 python
  • Javascript重新声明的全局变量覆盖旧值

    前几天我遇到了一个有趣的问题 想知道是否有人可以解释为什么会发生这种情况 这是我正在做的事情 出于本示例的目的 我稍微简化了示例 我正在使用方括号表示法创建一个全局范围的变量并为其分配一个值 后来我声明了一个与上面刚刚创建的变量同名的变量
  • 为什么 AutoResize 不适用于 C# 中 DataGridView 中的行标题宽度?

    我是 DataGridView 控件的新手 它让我很困惑 我遇到的问题是行标题宽度与其中的文本不太适合 我确实进行了搜索 但当前存在的解决方案并没有给我带来我所期望的结果 我正在使用此代码动态创建 DataGridView DataGrid
  • 成员变量可以用来初始化初始化列表中的其他成员吗?

    考虑以下 简化的 情况 class Foo private int evenA int evenB int evenSum public Foo int a int b evenA a a 2 evenB b b 2 evenSum eve
  • 如何将最小 DatePicker 日期设置为当前日期

    我想将用户可以在 DatePicker 中选择的最小日期设置为当前日期 我试过这个 DatePicker datePicker DatePicker findViewById R id event date datePicker setMi
  • 使用Python将数据加载到Mysql中

    可以用Python为Mysql建表吗 这是我的问题 我有一堆 txt 文件 我想将它们加载到 Mysql 数据库中 是否可以在 Python 中完成以下操作 而不是在 phpmyadmin 中手动创建表 创建表 包括数据类型定义 一一加载许
  • 在自定义对象上使用 ELKI 并理解结果

    我正在尝试使用ELKI的SLINK实现我的程序中的层次聚类 我有一组需要聚类的对象 属于我自己的类型 为此 我在聚类之前将它们转换为特征向量 这就是我目前让它运行并产生一些结果的方式 代码在 Scala 中 val clusterer ne