无监督聚类评价指标

2023-11-16

无监督聚类评价指标

SEE、SC和CH 寻找k

误差平方和(Sum of the Squared Errors, SSE),轮廓系数(Silhouette Coefficient)和CH指标(Calinski-Harabaz)
评价用于后验判断聚类K,如kmeans

评价指标-轮廓系数法(SC)

使用聚类的凝聚度和分离度,来评价聚类效果.

评价指标-CH系数法

Calinski-Harabasz:类别内部数据的距离平方和越小越好,类别之间的距离平方和越大越好这样的Calinski-Harabasz分数s会局,分数S高则聚类效果越好.

无监督聚类算法结果好坏的评价指标

无监督聚类算法结果好坏的评价指标

Compactness(紧密性)(CP)

在这里插入图片描述
在这里插入图片描述

CP计算每一个类各点到聚类中心的平均距离CP越低意味着类内聚类距离越近。著名的 K-Means 聚类算法就是基于此思想提出的。

缺点:没有考虑类间效果

Separation(间隔性)(SP)

在这里插入图片描述

SP计算 各聚类中心两两之间平均距离,SP越高意味类间聚类距离越远

缺点:没有考虑类内效果

Davies-Bouldin Index(戴维森堡丁指数)(分类适确性指标)(DB)(DBI)

在这里插入图片描述

DB计算 任意两类别的类内距离平均距离(CP)之和除以两聚类中心距离求最大值。DB越小意味着类内距离越小 同时类间距离越大

缺点:因使用欧式距离 所以对于环状分布 聚类评测很差

Dunn Validity Index (邓恩指数)(DVI)

在这里插入图片描述

DVI计算 任意两个簇元素的最短距离(类间)除以任意簇中的最大距离(类内)。 DVI越大意味着类间距离越大 同时类内距离越小

缺点:对离散点的聚类测评很高、对环状分布测评效果差

轮廓系数仅适用于某些算法,如K-Means和层次聚类。它不适合与DBSCAN一起使用,我们将使用DBCV代替。

https://towardsdatascience.com/unsupervised-machine-learning-clustering-analysis-d40f2b34ae7e
https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/89062335
https://github.com/christopherjenness/DBCV

参考:

  • https://www.zhihu.com/question/19635522/answer/1437553106
  • 督聚类评价指标:https://blog.csdn.net/u013709270/article/details/74276533
  • 机器学习中的各种评价指标:https://blog.csdn.net/u013181595/article/details/84631326
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

无监督聚类评价指标 的相关文章

  • O(n^2) 与 O (n(logn)^2)

    时间复杂度是O n 2 or O n logn 2 better 我知道当我们简化它时 它就变成了 O n vs O logn 2 and logn lt n 但是关于logn 2 n is only less than log n 2 f
  • 为 javascript 编写一个真正具有包容性的随机方法

    Javascript MATH 对象有一个随机方法 该方法从集合 0 1 返回 0 含 0 1 不包括 有没有办法返回一个真正随机的方法 其中包括 1 e g var rand MATH random 2 if rand gt 1 rand
  • 确保 unsigned int/long 始终在 C# 中的检查上下文中执行

    有没有人觉得奇怪 uint 和 ulong 的默认上下文是未检查的 而不是检查的 因为它们旨在表示永远不能为负的值 因此 如果某些代码试图违反该约束 在我看来 自然且首选的行为是抛出异常 而不是返回最大值 这很容易使重要数据处于无效状态并且
  • 在现代 x86-64 上计算 64 位整数的整数 Log10 的最快方法是什么?

    标题 我找到了大量 32 位示例 但没有找到完整的 64 位示例 使用这个帖子 https codegolf stackexchange com questions 47290 fastest way to compute order of
  • ValueError:数学域错误,不断弹出

    我时常收到此消息 我尝试了所有的变化 改变我使用 sqrt 的方式 一步一步地做 等等 但这个错误仍然不断出现 这可能是一个菜鸟错误 我没有注意到 因为我是 python 和 ubuntu 的新手 这是我的源代码 一个非常简单的程序 To
  • 以编程方式分解大量数字

    好吧 所以我有一个巨大的数字f 实际上 这个数字只有 100 多位数字长 我知道这些因子的大小大致相同 如果我的资源和时间有限 我应该使用什么语言和算法 我包括在限制时间内编写算法的时间长度 想法 编辑 我所说的有限是指在尽可能短的时间内
  • ID3和C4.5:“增益比”如何标准化“增益”?

    ID3算法使用 信息增益 度量 C4 5 使用 增益比 度量 即信息增益除以SplitInfo 然而SplitInfo对于记录在不同结果之间平均分配的分割 该值较高 否则较低 我的问题是 这如何帮助解决信息增益偏向于具有多种结果的分裂的问题
  • NSArray 中不重复的所有可能组合

    假设我有一个包含 3 个数字的数组 NSArray array 1 2 3 我想进行所有组合而不重复 所以我需要的是这样的 1 2 3 1 2 2 3 1 3 1 2 3 我当前的代码是这样的 NSArray array 1 2 3 int
  • 如何计算具有较大中间值的总和

    我想计算 for n m两个值都是 1000 以内的整数 最终结果是一个不大于 1000 的数字n但中间值对于 python 来说太大了 无法处理 你怎么解决这个问题 我将函数定义如下 from scipy misc import comb
  • 如何在编程中表示sqrt(-1)?

    我想代表sqrt 1 在C 中 因为我正在尝试实现FFT算法 有没有好的方法来表示这一点 我猜你正在寻找 include
  • 可被 N 整除的最小正数

    1 如何找到能被N整除的最小正数 并且它的各位数字和应该等于N 例如 N 结果 1 1 10 190 并且算法时间不应超过 2 秒 有什么想法 伪代码 pascal c 或 java 吗 设 f len sum mod 为 bool 这意味
  • 为什么反向传播神经网络中必须使用非线性激活函数? [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 我一直在阅读一些有关神经网络的内容 并且了解单层神经网络的一般原理 我理解需要额外的层 但为什么要使用非线性激活函数 这个问题后面跟着这个
  • 有没有办法根据值是大于 0.5 还是小于 0.5 来进行下限/上限?

    我正在尝试舍入我的价值观 以便如果它是0 5或更大 则变为1 否则就变成0 例如 3 7 gt 4 1 3 gt 1 2 5 gt 3 有任何想法吗 Math Round 3 7 MidpointRounding AwayFromZero
  • 最小对的总和

    Given 2N点 in a 2D plane 你必须将它们分组为N pairs使得所有对的点之间的距离的总和是最小可能值 所需的输出只是总和 换句话说 如果a1 a2 an分别是第一对 第二对 和第 n 对点之间的距离 则 a1 a2 a
  • 判断一个点是否在直角三角形内

    我一直想知道最简单的方法来确定一个点是否位于三角形内 或者在这种情况下 判断一个点是否位于对角线切成两半的矩形内 假设我有一个 64x64 像素的矩形 对于这个矩形 如果传递的点位于矩形的左上角 我想返回 TRUE 值 否则返回 FALSE
  • 生成随机数背后的数学(崩溃游戏 BTC Casino)

    我正在开发一款基于网络的游戏 其中有多个迷你游戏 我们坚持还添加一个在赌博界非常流行的崩溃游戏 然而 我们一直在努力理解生成随机 几乎不可预测 数字的概念 大多数赌博网站都会提供哈希值等来证明数字未被篡改 我们真的不需要这个 因为我们的游戏
  • 将大数字转换为字母(然后再转换回来)

    是否有一个术语来描述将大数字存储为字母的想法 例如 假设我有 相对较小的 数字 138201162401719 并且我想将字符数缩小到尽可能少的字符数 我知道这无助于节省磁盘空间 英文字母表中有 26 个字母 但我将它们算作 25 个 因为
  • Math.random() 在 JavaScript 中如何工作?

    我最近想出了如何通过谷歌获取随机数 这让我思考如何Math random 工作 所以我在这里我无法弄清楚他们是如何做到 Math random 的 除非他们使用了类似时间的东西 有谁知道 JavaScript 是如何做到的吗 Math ra
  • C# 中的反转数

    有没有一种简单的方法可以用函数反转 C 中的数字 我正在使用 XNA 我想告诉我的程序 如果我的 变量 超过某个数字 它必须反转它的值 重点是提供反弹效果 if ballPosition X gt screenWidth Invert th
  • 如何计算 3D 坐标的线性索引,反之亦然?

    如果我有一个点 x y z 如何找到该点的线性索引 i 我的编号方案是 0 0 0 是 0 1 0 0 是 1 0 1 0 是最大 x 维度 另外 如果我有一个线性坐标 i 我如何找到 x y z 我似乎无法在谷歌上找到这个 所有结果都充满

随机推荐

  • Docker容器与虚拟化技术:Docker架构、镜像操作

    目录 一 理论 1 Doker概述 2 Docker核心概念 3 Docker安装 4 Docker的镜像管理命令 二 实验 1 Docker安装 2 查看Docker信息 3 Docker的镜像管理命令 三 问题 1 如何注册Docker
  • C++友元声明与定义依赖关系

    ifndef A H define A H include
  • 小程序日期(日历)时间 选择器组件

    封装一个小程序日期 日历 时间 选择器组件 简要说明 一共两个版本 date time picker 和 date time picker plus date time picker 弹窗层是 基于 vant weapp 的 van pop
  • 机器学习之数据预处理

    1 导入需要的库 Numpy Pandas 2 导入数据集 3 处理丢失数据 数据可能是因为各种原因丢失 未了不降低机器学习模型的性能 需要处理数据 我们可以用整列的平均值 或中间值替换丢失的数据 我们用sklearn preprocess
  • STM32F103-定时器

    STM32F103系列的单片机一共有11个定时器 其中 1个系统嘀嗒定时器 2个看门狗定时器 2个基本定时器 TIM6和TIM7 4个通用定时器 TIM2 TIM5 2个高级定时器 TIM1和TIM8 基本定时器 TIM6和TIM7 只具有
  • springmvc+mongodb+maven 项目搭建配置

    操作步骤我就不再细化了 项目能运行 测试过了 先上配置 另一篇文章上代码 源码地址 http pan baidu com s 1pJslZ0v 项目结构 pom xml
  • react井字棋---最全井字棋小游戏教程

    上一期我们利用create react app搭建了好了一个react项目 这期我们通过跟随React官方教程 编写一个 井字棋 小游戏 来熟悉react的基本用法 首先来看下 井字棋 的最终实现效果 从演示中我们可以看到 这个游戏大致有以
  • JavaScript Math

    JavaScript Math 算数 对象 Math 算数 对象的作用是 执行常见的算数任务 在线实例 round 如何使用 round random 如何使用 random 来返回 0 到 1 之间的随机数 max 如何使用 max 来返
  • 14.进程间通信

    一 进程间通信概述 1 目的 1 数据传输 一个进程需要将它的数据发送给另一个进程 2 资源共享 多个进程之间共享同样的资源 3 通知事件 一个进程需要向另一个或一组进程发送消息 通知它们发生了某种事件 4 进程控制 有些进程希望完全控制另
  • 再谈Linux epoll惊群问题的原因和解决方案

    差别是什么 差别只是西装 缘起 近期排查了一个问题 epoll惊群的问题 起初我并不认为这是惊群导致 因为从现象上看 只是体现了CPU不均衡 一共fork了20个Server进程 在请求负载中等的时候 有三四个Server进程呈现出比较高的
  • Git进行pull时,出现please enter the commit message for your changes...

    在服务端更新代码时 git pull时总是出现需要编辑一个commit message git status 查看了下 原来是服务端有部分代码需要commit后尚未push导致 这种问题 解决办法如下 如果你本地仓库不需要push 这里编辑
  • 自定义指令、具名卡槽的使用与演示

    目录 一 v model简化代码 二 sync修饰符 三 ref 与 refs 四 自定义指令 五 插槽 默认插槽 六 具名卡槽 一 v model简化代码 1 目标 父组件通过v model简化代码 实现子组件和父组件数据双向绑定 2 如
  • np.array()函数

    函数调用方法 numpy array object dtype None 各个参数意义 object 创建的数组的对象 可以为单个值 列表 元胞等 dtype 创建数组中的数据类型 返回值 给定对象的数组 普通用法 import numpy
  • 【C语言】用迭代法求平方根。

    include
  • jar包启动、停止、重启脚本

    启动命令 sh start sh start 停止命令 sh start sh stop 重启命令 sh start sh restart 注意 1 把test jar改成自己的jar包名 2 把文件命名为start sh 在linux环境
  • JavaScript(7)本地存储,函数深入理解

    1 本地存储 1 1本地存储特性 数据存储在用户浏览器中 设置和读取数据方便 而且页面刷新不丢失数据 容量较大 sessionStorage约5M localStorage约20M 只能存储字符串 可以将对象JSON stringify 编
  • css - 选择器

    css 选择器 css选择器用于选择html元素 为其设置css样式 选择器不会选择纯文本 只选择html元素 ID选择器 html标签的唯一编号由id属性指定 通过使用id的形式可以选择指定的元素对象 慎用id选择器 因为css不会检测i
  • 我所理解的DRM显示框架

    什么是DRM DRM全称是DirectRenderingManager 是linux主流的一种显示框架 支持多图层合成 为用户图层提供统一的API libdrm 来访问GPU 实现统一管理 它是为了解决多个程序对video card访问协同
  • 数据结构 数学知识复习

    文章目录 指数 对数 级数 模运算 证明方法 归纳法证明 反例法证明 指数 X A X B
  • 无监督聚类评价指标

    无监督聚类评价指标 文章目录 无监督聚类评价指标 SEE SC和CH 寻找k 评价指标 轮廓系数法 SC 评价指标 CH系数法 无监督聚类算法结果好坏的评价指标 Compactness 紧密性 CP Separation 间隔性 SP Da