【数据挖掘】属性的概念

2023-11-09

1、属性: 一个数据字段,表示数据对象的一个特征。(属性(数据挖掘和数据库人员使用)、维(数据仓库)、特征(机器学习)、变量可以互换实用(统计学家使用))
 
2、标称属性:标称意味着“与名称相关”;标称属性的值是一些符号或失误的名称。每个只代表某种类别、编码或者状态,因而标称属性又被堪称是分类的。例如,人的属性->头发颜色(黑、白、棕、红、黄...)和婚姻状况(未婚、已婚、离异...)属于标称属性。其实也就是枚举的属性。
    标称属性值可以用数字表示,如1,2,3等;但是这些值并不具有有意义的序,并且不是定量的,因而这种属性的均值、中位数是没有意义的。众数是有意义的。
 
3、二元属性:是一种标称属性,只有两种类别(状态):0和1,通常0表示该属性不出现,1表示出现。又称为布尔属性(true 和 false)。
    二元属性又分对称的和非对称的: 对称指两种状态具有同等价值且相同的权重,如性别(男、女);非对称是指状态的结果不是同样重要的,如病毒化验结果(阳性、阴性)。
 
4、序数属性:其可能的值之间具有有意义的序或秩评定,但是相继值之间的差是未知的。序数属性通常用于等级评定调查。
标称、二元和序数属性都是定性的,他们描述对象的特征,而不给出实际大小或数量。定性属性的值通常是代表类别的词。
 
5、数值属性:是定量的,他是可度量的量,用证书或实数值表示,数值属性可以是区间标度的或比率标度的。
    区间标度属性:属性用相等的单位尺度度量。区间熟悉的值有序,例如: 20度,15度(温度属性);
    比率标度属性:具有固定零点的数值属性,即一个值是另一个的倍数(比率)。比率值也是有序的,可以计算值之间的差、也能计算均值、中位数、众数。
 
6、离散属性与连续属性:机器学习领域开发的分类算法通常把属性分类成离散或连续的。
    离散属性:具有有限或无限可数个值,可以用或不用整数表示,如头发颜色、婚姻状况都是有限个值,是离散的。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【数据挖掘】属性的概念 的相关文章

  • 利用神经网络识别12306验证码——(五)训练模型

    需要训练的有两个模型 一个是文本识别模型 一个是图像识别模型 在训练的时候 尝试了ResNet50 ResNet101 MobileNetV2 三种模型 前两个残差神经网络模型的参数比较大 训练比较耗时 精度上也逊色于第三个模型 尝试了RT

随机推荐

  • Android7.0以上自动更新安装apk

    Android7 0以上加了很多特性 也对系统做了很多的优化和升级 而在对Uri的访问上也做了改变 以下用安装apk的例子来说明 对于程序 我们要实现程序能够自动检查更新安装 我们需要给程序赋予权限
  • 狼人杀服务器维护时间,狼人杀官 方将于11月30日进行停机维护

    狼人杀官 方将于11月30日进行停机维护 此次更新将更改一些设定 新增活动和关闭前面的活动 优化和修复一下问题 狼友们可以了解一下更新内容 亲爱的狼队友 为了保证服务器的稳定和服务质量 我们将于2017年11月30日10 00进行停机维护工
  • LeetCode算法题合集—链表篇

    链表基础算法题 链表的定义 java 单链表的定义 public class ListNode int val ListNode next 指向下一节点 ListNode 无参构造 ListNode int val this val val
  • 封玩家IP和机器码以及解开被封的教程

    封玩家IP和机器码以及解开被封的教程 关于封玩家IP地址的方法 可能在十多年前的第一代传奇引擎上就有了 但封机器码的功能 是GOM以后才看到的 早先的引擎上面并没有这个功能 比如HERO或者LEG等 虽然十多年前就有 但还是有不少GM 在开
  • Photomatix Pro for Mac HDR图像处理器

    Photomatix Pro是一款专业的HDR 高动态范围 照片处理软件 可以帮助用户将多张不同曝光度的照片合成一张高质量的HDR照片 并提供了丰富的HDR处理工具和效果 可以让用户轻松地创建出令人惊叹的HDR照片 Photomatix P
  • tesseract 训练---别人的东东

    关于tesseract ocr3的训练和使用 众所周知 这是一个出色的字符识别软件 这个开源项目可以在http code google com p tesseract ocr downloads list下载 在使用时 建议使用3而不要使用
  • OBS CLR插件开发

    本文所述的OBS 插件编写基于OBS CLRHostPlugin 使用C 语言写成 IDE为VS2012 完整代码详见Github 仓库地址 Part 创建工程 首先创建一个C 的项目 项目类型为类库 ClassLibrary 使用 NET
  • 多个类操作同一个Ui界面的方法(音乐播放器前期总结)

    最近自己在做类似于QQ音乐的播放器 用Qt模仿它的界面去写的 本地音乐播放功能差不多实现 除了歌词 现在已实现的功能 1 本地歌曲播放 2 播放 暂停 下一首 上一首 3 从文件夹添加歌曲至本地歌曲列表并显示 同时添加至数据库 数据库保存歌
  • Android 查看签名文件的MD5 SHA1值

    1 找到存放签名文件所在的文件夹 2 输入命令 keytool list v keystore atui jks 3 输入口令 keystore jks签名文件的密码
  • 机器学习--梯度下降法(BGD、SGD、MBGD)

    1 梯度 在微积分里面 对多元函数的参数求 part 偏导数 把求得的各个参数的偏导数以向量的形式写出来 就是梯度 比如函数 f x y f x y 分别对 x y x y求偏导数 求得的梯度向量就是 xf yf T frac part p
  • Ubuntu sudo 出现unable to resolve host 解决方法

    Ubuntu sudo 出现unable to resolve host 解决方法 Ubuntu环境执行sudo的时候都会 弹出如下的警告 上面大概的意思就是 sudo 无法解决主机 iZwz90a11x50xdx5dle0wgZ 我们可以
  • MySQL学习系列(4)-每天学习10个知识

    目录 1 InnoDB 和 MyISAM 2 SQL调优 3 数据一致性问题的解决 4 MySQL的存储引擎 5 MySQL的内存使用问题 6 索引比全表扫描慢的情况 7 行级锁和表级锁 8 MySQL的复制功能 9 数据库性能测试 10
  • CentOS8使用network.service服务管理网络

    前言 在CentOS8中 我们常用的network service服务就被NetworkManager service服务代替了 同样的 IP的配置方法也发生了改变 那么如果想使用network service服务去管理 配置系统网络怎么办
  • C语言实现扫雷 【递归扩展】 【超详细解析】

    扫雷游戏介绍 扫雷 是一款大众类的益智小游戏 于1992年发行 游戏目标是在最短的时间内根据点击格子出现的数字找出所有非雷格子 同时避免踩雷 踩到一个雷即全盘皆输 游戏规则 扫雷是电脑上一款非常经典的单机游戏 它的基本规则是 如果你点击一个
  • Linphone的简单使用

    目前参与了几个SIP项目 用到了几个软件 回过头来写下使用过程吧 使用的软电话是一个叫做Linphone的软件 首先拿到的是一个安装版的 感觉用不了几次 就没有安装 后来看到还有一个用QT编写的绿色版 就使用了该版本 界面简洁 QT绿色版
  • idea必备插件

    最近公司开发工具从 eclipse 全部切换到了 IntelliJ IDEA 为了提升公司开发效率 所以从网上搜集了一些常用的 IntelliJ IDEA 实用的开发插件 用于提升团队开发效率 现在在这里进行分享 让更多的人能够提升开发效率
  • http重定向流程与https证书校验流程

    http重定向 原理 在 HTTP 协议中 重定向操作由服务器通过发送特殊的响应 即 redirects 而触发 HTTP 协议的重定向响应的状态码为 3xx 浏览器在接收到重定向响应的时候 会自动采用该响应提供的新的 URL 并立即进行加
  • 10种不同类型的移动UI设计模式

    编者按 图灵教育 推荐了 移动应用UI设计模式 一书 在书中用户体验设计师Theresa Neil 介绍了包括反模式在内的10种不同类型的设计模式 无论你正在设计一款简单的iPhone应用 还是开发适用于当前市场上所有流行移动操作系统的应用
  • 【MATLAB第52期】#源码分享

    MATLAB第52期 源码分享 基于MATLAB的高斯过程GPR超参数 sigma 自动优化算法 时间序列预测模型 五折交叉验证 后台私信回复 52期 即可免费获取数据及代码 一 效果展示 二 优化思路 1 数据 一列时间序列数据 滑动窗口
  • 【数据挖掘】属性的概念

    1 属性 一个数据字段 表示数据对象的一个特征 属性 数据挖掘和数据库人员使用 维 数据仓库 特征 机器学习 变量可以互换实用 统计学家使用 2 标称属性 标称意味着 与名称相关 标称属性的值是一些符号或失误的名称 每个只代表某种类别 编码