【数据挖掘】期末复习:ID3、DBSCAN、关联分析、离群点挖掘等

2023-10-31

小题

一些要背

数据挖掘的定义
技术层面:数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中、人们事先不知道的、但又潜在有用的信息的过程。

商业层面:数据挖掘是一种新的商业信息处理技术,其主要特点是对商业业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。

记法:
技术层面:从5的实际应用数据,提取3的信息。
商业层面:对业务数据进行4,从中…

区分分类和聚类

  • 以图搜图——聚类
  • 人脸识别、垃圾邮件检测、扑克牌按花色分组——分类

计算

余弦相似度:两个向量相乘,再除以它们的模。
在这里插入图片描述
相关系数:标准化后的余弦相似度。相关系数越接近1或-1,则两特征相关性越强,越接近0,相关性越弱。
在这里插入图片描述

欧几里得距离
d = ( p 1 x − p 2 x ) 2 + ( p 1 y − p 2 y ) 2 d=\sqrt{(p1_x-p2_x)^2+(p1_y-p2_y)^2} d=(p1xp2x)2+(p1yp2y)2
在这里插入图片描述

曼哈顿距离
d = ∣ ( p 1 x − p 2 x ) ∣ + ∣ ( p 1 y − p 2 y ) ∣ d=|(p1_x-p2_x)|+|(p1_y-p2_y)| d=(p1xp2x)+(p1yp2y)
在这里插入图片描述
截断均值:
书p24.

指定0~100间的百分位数p,丢弃高端和低端(p/2)%的数据,然后用常规方法计算均值,所得结果即是截断均值。标准均值是对应于p=0%的截断均值。

例题:计算{1,2,3,4,5,90}值集的p=40%的截断均值。
答:3.5.

大题

分类

ID3

递归终止的条件:
在这里插入图片描述

第一步:计算总的信息量(标签)
在这里插入图片描述
第二步:选一个做根节点。

若选天气做根节点:
在这里插入图片描述
若选气温做根节点:
在这里插入图片描述
若选湿度作为节点:
在这里插入图片描述
若选风作为根节点:
在这里插入图片描述
选择信息增益gain最大的作为根节点。
因此我们这里选择天气作为根节点。

第三步:

计算天气为晴的时候的信息增益。
可知,当湿度为下一个节点时信息增益是最大的,所以中间的图是对的。
在这里插入图片描述

第四步:算天气为多云时的信息增益。
再往下看,我们发现,当天气为多云时,目标属性全都是一个值。则不需要再算信息增益了。
在这里插入图片描述
第五步:算天气为雨的信息增益。
在这里插入图片描述
最终的决策树:
在这里插入图片描述
可以这样画:属性是圆圈,标签是方框。
在这里插入图片描述

一个练习:
ps:
我们考试要把info写成Entropy(信息熵)
数据集为S,属性为wind的划分,则其信息增益表示为Gain(S,wind)
在这里插入图片描述
其实跟上面的例题是一样的,大概过程格式如下 (字太丑了,将就看一下吧)
在这里插入图片描述

C4.5

信息增益率=信息增益/分裂信息。

在这里插入图片描述
为什么要有信息增益率?
答:因为要兼顾为获得信息增益所付出的“代价”。

关于信息增益率怎么算:
如上表,若以temperature为划分,则共14个样本:4个hot、6个mild、4个cool。
则:
在这里插入图片描述

CART(Gini系数)

CART算法使用Gini系数来度量对某个属性变量测试输出的两组取值的差异性。理想的分组应该尽量使两组中样本输出变量取值的差异性总和达到最小,即“纯度”最大,也就是使两组输出变量取值的差异性下降最快,“纯度”增加最快。

在这里插入图片描述
如何计算基尼系数?

例1:

label1=5,
label2=5;

则:

p(1)=0.5;
p(2)=0.5;
Gini=1-p(1)*p(1)-p(2)*p(2)=0.5;

例2:

label1=8,
label2=2;

则:

p(1)=0.8;
p(2)=0.2;
Gini=1-p(1)*p(1)-p(2)*p(2)=0.32;

例3:

label1=0,
label2=1;

则:

p(1)=0;
p(2)=1;
Gini=1-p(1)*p(1)-p(2)*p(2)=0;

由上面3个例子可知,当Gini系数是0.5时,说明这个属性的分类处于一个非常混乱的状态,当Gini系数为0时,说明这个属性分类分的纯度很高。
如果一个属性的Gini系数都非常小,那么我们可以说这个属性是很好的区分类别的属性。
——所以我们可以通过基尼系数来选择属性。

基尼加权的计算:
在这里插入图片描述
有房的:3
没房的:7.

对于有房的,有3个人不拖欠,0个人拖欠。则Gini=1-1=0
对于没房的,有4个人不拖欠,3个人拖欠。则Gini=1-(3/7)x(3/7)-(4/7)x(4/7)=24/49

因此,加权基尼系数为:3/10 x 0+7/10 x 24/49 =12/35

关于基尼系数增益,看这里:决策树:什么是基尼系数(“杂质 增益 指数 系数”辨析)

K近邻

在这里插入图片描述

ID3、C4.5、K近邻优缺点

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

分类评价

  • 分类准确率
  • 计算复杂性
  • 可解释性
  • 可伸缩性
  • 稳定性
  • 强壮性

朴素贝叶斯

在这里插入图片描述
朴素贝叶斯为什么朴素?
因为它假设样本特征彼此独立,没有相关关系。而这在现实中不存在。

怎么用它分类——看这个,瞬间会了:【决策树算法4】朴素贝叶斯算法 数据挖掘 期末考试 计算题 详细步骤讲解
在这里插入图片描述

聚类

K-means

书p112

快速理解:
在这里插入图片描述
步骤:
在这里插入图片描述
流程:
k-means算法基本步骤

  1. 从数据中选择k个对象作为初始聚类中心;
  2. 计算每个聚类对象到聚类中心的距离来划分;
  3. 再次计算每个聚类中心
  4. 计算标准测度函数,之道达到最大迭代次数,则停止,否则,继续操作。

例子:
在这里插入图片描述
在这里插入图片描述

k-means算法的优缺点
优点为算法描述容易、实现简单、快速
缺点如下:
(1)簇的个数k难以确定
(2)聚类结果 对初始簇中心的选择较敏感
(3)对噪音和异常数据敏感
(4)不能用于发现非凸形状的簇,或具有各种不同大小的簇。

DBSCAN

书p127-130

一个非常直观的DBSCAN算法演示:DBSCAN聚类 动画演示

相关概念:
在这里插入图片描述
核心点:半径为r的邻域内,包含数据点的个数不小于某个阈值。
边界点:属于某一个簇的非核心点。
离群点:不属于任何一个类的点。
在这里插入图片描述

例题:
在这里插入图片描述

解:
在这里插入图片描述

在这里插入图片描述

DBSCAN算法的优点:**可以识别具有任意形状和不同大小的簇,自动确定簇的数目,分离簇和环境噪声,一次扫描数据即可完成聚类。**如果使用空间索引,DBSCAN 的计算复杂度是O(N log N),否则计算复杂度是O(N2)。

一趟聚类算法

书p138-140.
优缺点:
省流:
优点:近似线性时间复杂度;高效,参数选择简单,对噪声不敏感。
缺点:不能用于发现非凸形状的簇,或具有各种不同大小的簇;对数据样本的顺序比较敏感

不省流:
一趟聚类算法具有近似线性时间复杂度,类似于 k-means算法,其本质上是将数据划分为大小几乎相同的超球体,不能用于发现非凸形状的簇,或具有各种不同大小的簇。

对于具有任意形状簇的数据集,算法可能将一个大的自然簇划分成几个小的簇,而难以得到理想的聚类结果。与k-means 算法不同,一趟聚类算法对数据样本的顺序比较敏感,通过聚类阈值的改变来影响聚类得到的簇个数。大规模数据集的聚类可以采用类似 BIRCH算法的两阶段聚类思想,结合一趟聚类算法的高效性及其他可识别任意形状簇的聚类算法的优点得到混合聚类算法。如选取较小的阈值,利用一趟聚类算法产生初始聚类,将得到的簇作为整体看成对象,再利用DBSCAN、Chameleon、SNN 等可以识别任意形状数据的算法进行聚类,可以得到很好的效果。

在这里插入图片描述

层次聚类

书p121.

层次聚类方法可分为自顶向下和自下而上两种。

自下而上聚合层次聚类方法(或凝聚层次聚类)。这种自下而上策略就是最初每个对象(自身)作为一个簇,然后将这些簇进行聚合以构造越来越大的簇,直到所有对象均聚合为一个簇,或满足一定终止条件为止。绝大多数层次聚类方法属于这一类,只是簇间相似度的定义有所不同。

自顶向下分解层次聚类方法(或分裂层次聚类)。这种方法的策略与自下而上的凝聚层次聚类方法相反。它首先将所有对象置于同一个簇,然后将其不断分解,而得到规模越来越小但个数越来越多的小簇,直到所有对象均独自构成一个簇,或满足一定终止条件为止。

在这里插入图片描述

关联分析

例题如下:
在这里插入图片描述
{A}的支持度:{A}出现的次数除以事务个数(这里是10)。

求最大频繁项目集
在这里插入图片描述
L3是不存在的,所以L2{AC}{DE},L1{A}{B}{C}{D}{E}{F}
最大频繁项目集:{AC}{DE}{B}{F}

{B}{F}怎么来的:L1中的不能出现在L2中,L2中的不能出现在L3中的频繁项集也是最大频繁项目集。

注意:
书p155说,对于频繁2项集,如果第一项相同,则合并组合生成候选3项集。 所以这里{AC}{DE}是没法合并成候选3项集的。

找出所有的强关联规则

强关联规则:同时满足最小支持度和置信度。
我们在第一问中已经找出频繁项目集了,所以只需要在频繁项目集中找出置信度>=60%的就可以了。

置信度:P(A->C)即A发生的情况下C也发生,即P(AC)/P(A)。
在这里插入图片描述

Apriori算法利用以上性质,逐层生成关联规则。先产生后件只包含一项的关联规则,然后两两合并这些关联规则的后件,生成后件包含两项的候选关联规则,从这些候选关联规则中再找出强关联规则,以此类推。
例如,{a b c d}是频繁项集,如果{a c d}→{(b}和{a b d}→{c}是两个高置信度的规则,则通过合并这两个规则的后件{b c},候选规则的前件为{a b c d)-{b c}={a d},得到候选规则{a d}→{b c}

离群点挖掘(OF1、OF3)

合理的异常点是允许存在的。
x的k-近邻的集(x,k)包含的对象可能超过k

OF1
概念:
在这里插入图片描述
例题:
在这里插入图片描述
步骤:
k=2,则选对P1、P2来说最近的两个点(如果有距离一样的,那都算上),算它们的距离。
比较它们的平均值哪个大,大的是离群点(毕竟大的更远)。

在这里插入图片描述
在这里插入图片描述

OF3
问P1、P2哪个点是离群点。
已知有三个簇,要算这三个簇的质心
计算点到质心的欧式距离
OF3是其加权后的距离长度——如一共有N个点,这个簇有n个点,则这个簇的距离就是 P点到质心的欧式距离 x n/N(详情看解答,一看就懂)。
OF3值大的是离群点,因为距离远。
在这里插入图片描述
在这里插入图片描述

解答:
在这里插入图片描述
故P1是离群点。

后面这个了解一下:
在这里插入图片描述

简答

评估分类模型准确率的方法包括:保持、随即子抽样、交叉验证和自助法等。

关联规则挖掘算法可分为两个步骤:

  1. 产生频繁项集:发现满足最小支持度阈值的所有项集、即频繁项集
  2. 产生规则:从上一步发现的频繁项集中提取大于置信度阈值的规则,即强规则。

聚类算法:

  • K-means 基于划分
  • DBSCAN 基于密度

K-means算法的流程:

  1. 随机选择k个对象,每个对象代表一个簇的初始均值或中心
  2. 对剩余的每个对象,根据其与各簇中心的距离,将它指派到最近的簇,然后计算每个簇的新均值,得到更新后的簇中心
  3. 不断重复,直到准则函数收敛

在这里插入图片描述
在这里插入图片描述

参考资料

《数据挖掘原理与实践》-电子工业出版社
师兄师姐留的提纲
评定数据之间的相似度指标----距离
【决策树算法1】ID3算法 数据挖掘 期末考试 计算题 详细步骤讲解
【数据挖掘】决策树零基础入门教程,手把手教你学决策树!
机器学习:信息熵,基尼系数,条件熵,条件基尼系数,信息增益,信息增益比,基尼增益,决策树代码实现(一)
Apriori算法原理
期末数据挖掘关联规则的apriori 算法计算大题
一个非常直观的DBSCAN算法演示:DBSCAN聚类 动画演示
【帅器学习/星辰】DBSCAN算法
【10分钟算法】K均值聚类算法-带例子/K-Means Clustering Algorithm
【期末划重点】数据挖掘
什么是KNN(K近邻算法)?【知多少】
【决策树算法4】朴素贝叶斯算法 数据挖掘 期末考试 计算题 详细步骤讲解

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【数据挖掘】期末复习:ID3、DBSCAN、关联分析、离群点挖掘等 的相关文章

  • 对话数据宝董事长汤寒林:数据要素崛起的背后是产业链的爆发

    数字经济再添新概念 数据要素的来到会对行业产生什么影响 数科星球原创 作者丨苑晶 编辑丨十里香 从小众的极客文化再到被众多企业所接纳 信息科技已经历70余年 现在 随着越来越多的企业开始拥抱数据产业之时 数据的有效利用成为企业间备受关注的话
  • DataFrame对象创建

    文章目录 前言 一 创建DataFrame对象 二 使用步骤 前言 一 创建DataFrame对象 示例 将字典 年龄 23 22 21 岗位 客服 运营 公关 年购买量 10 15 8 转换成一个DataFrame对象 二 使用步骤 代码
  • Python入门到实战(十一)无监督学习、KMeans、KNN、实现图像分割、监督学习VS无监督学习

    Python入门到实战 十一 无监督学习 KMeans KNN 实现图像分割 监督学习VS无监督学习 无监督学习unsupervised learning 特点 应用 K均值聚类 核心流程 核心公式 KMeans VS KNN 实战 KMe
  • 活动报名

    活动议程 日期 5月5日 周五 时间 主题 14 30 14 35 开场简介 袁洋 清华大学交叉信息学院助理教授 青源会会员 14 35 15 20 环境不变最小二乘回归 方聪 北京大学智能学院助理教授 青源会会员 15 20 15 50
  • 2021 CCF大数据与计算智能大赛个贷违约预测top 73 解决方案

    目录 一 概述 二 解题过程 2 1 数据 2 2 构建基线 2 3 进阶思路一 2 4 进阶思路二 2 5 进阶思路三 2 6 融合 2 7 调优提分过程 2 8 其他工作 三 结语 一 概述 这是我第二次参加大数据类型的竞赛 也是第一次
  • Google Voice账号的具体保号教程

    Google Voice 官方号码回收规则 https www google com intl zh CN googlevoice program policies html 在9个月内你的Google Voice没拔打电话或接收短信 你的
  • 数据挖掘知识浅析

    一 什么是数据挖掘 数据挖掘是指从大量数据中提取或 挖掘 知识 数据挖掘是一种 黄金挖掘 从沙子堆中挖掘出黄金 找出最有价值的黄金 这种有机的价值物提取的过程称为 黄金挖掘 通过某种手段或者经验丰富人士 从海量的数据中找出有用的 数据 掌握
  • 软考:中级软件设计师:程序语言基础:表达式,标准分类,法律法规,程序语言特点,函数传值传址

    软考 中级软件设计师 程序语言基础 表达式 提示 系列被面试官问的问题 我自己当时不会 所以下来自己复盘一下 认真学习和总结 以应对未来更多的可能性 关于互联网大厂的笔试面试 都是需要细心准备的 1 自己的科研经历 科研内容 学习的相关领域
  • 数据分析36计(22):分析师入门常见错误 "幸存者偏差",如何用匹配和加权法规避...

    在日常功能迭代分析中 一般会直接看使用该功能和未使用该功能的用户在成功指标上的表现 将两组数据求个差异值就得出功能的效果结论 但是有敏锐的分析师会发现 功能大部分情况下有筛选效应 即使用该功能的用户可能本身质量比较高 活跃比较频繁 用以上的
  • 淘宝开放API列表展示(含测试链接)

    item get 获得淘宝商品详情 测试入口 item get pro 获得淘宝商品详情高级版 item review 获得淘宝商品评论 item fee 获得淘宝商品快递费用 item password 获得淘口令真实url item l
  • 鲸鱼算法(WOA)优化极限学习机ELM回归预测,WOA-ELM回归预测,多变量输入模型

    作者简介 热爱科研的Matlab仿真开发者 修心和技术同步精进 代码获取 论文复现及科研仿真合作可私信 个人主页 Matlab科研工作室 个人信条 格物致知 更多Matlab完整代码及仿真定制内容点击 智能优化算法 神经网络预测 雷达通信
  • 天猫数据分析-天猫查数据软件-11月天猫平台饮料市场品牌及店铺销量销额数据分析

    今年以来 饮料是快消品行业中少数保持稳定增长的品类之一 11月份 饮料市场同样呈现较好的增长态势 根据鲸参谋电商数据分析平台的相关数据显示 今年11月份 天猫平台上饮料市场的销量为2700万 环比增长约42 同比增长约28 销售额为13亿
  • 探索关系:Python中的Statsmodels库进阶

    目录 写在开头 1 多元线性回归 场景介绍 2 Logistic回归 2 1 Logistic回归的概念 2 2 应用案例 2 2 1 建立模型和预测
  • 深入挖掘:Python中的Statsmodels库高级应用

    写在开头 随着数据科学的发展 解决更为复杂问题的关键往往在于深入了解数据并采用更高级的分析工具 本文将带您深入探讨Python中的Statsmodels库 并引入一些高级功能 为更深入的数据挖掘奠定基础 1 方差分析 1 1 方差分析概念
  • 航空港务数据大屏为航空港的可持续发展提供有力支撑!

    随着经济的发展 不断加建与扩建民用机场 空港行业规模不断扩大 在不断引进和消化发达国家先进技术的同时 中国深入开展了对新技术和新材料的研究 极大地丰富和发展了中国的机场建设技术 且各项机场建设计划均已落实推进 行业在经济发展的推动下欣欣向荣
  • Pendulum详解1——Pendulum库入门指南 - 时光的艺术

    写在开头 时间 是编程世界中不可或缺的元素 无论是事件调度 数据分析 还是用户界面的显示 时间都扮演着关键的角色 然而 在Python的标准库 datetime 中 我们经常面临繁琐的操作和限制 为了摆脱这些束缚 我们引入了一个更加强大和灵
  • 振弦采集仪在地基沉降监测中的应用研究

    振弦采集仪在地基沉降监测中的应用研究 振弦采集仪是一种专门用于测量地基沉降的仪器 它采用振弦原理来测量地基的沉降情况 振弦采集仪通过在地基上安装一根细长的弹性振弦 并测量振弦的变形来获得地基沉降的数据 在地基沉降监测中 振弦采集仪可以提供精
  • 数据分析求职-面试技巧

    之前咱们已经分享了岗位介绍 求职准备思路 简历如何准备 今天咱俩聊一聊面试的技巧 1 面试流程 咱们先聊聊面试的基本流程 简历 笔试筛选 gt 技术初面 gt 技术二面 gt 技术三面 gt 技术交叉面 gt HR面 这个过程中有几个点值得
  • 如何快速搭建一个自营商城?(调用电商API实现快速采集商品)

    一 背景介绍 在数字化时代 电商行业蓬勃发展 无数商家涌入这片蓝海 对于许多有志于开拓电商业务的企业和个人来说 快速搭建一个自营商城成为了迫切的需求 然而 传统意义上的自建商城需要投入大量的人力 物力和时间 这让许多初创企业和个人望而却步
  • 番外篇-Julius AI帮你做数据分析

    今天咱们聊聊如何利用AI大模型来做数据分析 非常适合小白体验 尤其是缺乏项目经验的同学 强烈建议关注收藏 也欢迎私信交流 1 站在巨人肩膀 在数据分析领域 AI技术的飞速发展正引领一场革命 随着大型机器学习模型的不断完善 数据分析变得前所未

随机推荐

  • 【信号与系统】1、初步认识信号与系统

    文章目录 1 信号的概念 1 1 信号的定义 1 2 因果 逆因果信号的概念 1 2 1 因果信号 1 2 2 逆因果信号 1 2 3 时限信号 1 2 4 右边信号 1 2 5 左边信号 1 2 6 双边信号 2 信号的分类 2 1 确定
  • 浅显易懂 SQLite3 笔记(04)— SQL数据更新(增加、删除、修改)

    文章目录 前言 一 插入数据 二 修改数据 三 删除数据 总结 前言 我们在上一篇博文 浅显易懂 SQLite3 笔记 03 SQL数据查询 超级详细 学习了如何使用SQL语句进行数据查询 本篇 我们将继续学习如何使用SQL语句进行数据更新
  • ubuntu14.04 64bit 安装 && 破解quartus13.0 记录

    安装文件 Quartus 13 0 0 156 linux iso Quartus 13 0 0 156 devices 1 iso 1 挂载 sudo mount o loop Quartus 13 0 0 156 linux iso m
  • CocoaPods:“Use the `$(inherited)` flag” or “Remove the build settings from the target”

    问题背景 解决方法 总结 阅读之前注意 本文阅读建议用时 5min 问题背景 CocoaPods导库的时候 出现了如下情况 The project Debug target overrides the PODS CONFIGURATION
  • docker 复制镜像和复制容器

    复制镜像和复制容器都是通过保存为新镜像而进行的 具体为 保存镜像 docker save ID gt xxx tar docker load lt xxx tar 保存容器 docker export ID gt xxx tar docke
  • C#之Yield Return语法的作用和好处

    还是和以前一样 我先上代码 请大家先拿到我的代码或者你跟着敲 运行看效果 以及理解每行带代码的作用 我们要带着为什么要用Yield这个关键字 不用可以吗这个目的去学知识 我相信会更加的有意思 首先我贴出平时正常输出偶数集合的办法 学习Yie
  • 编译内核函数copy_from_user()和copy_to_user()

    文章目录 一 定义 二 例子 三 问题 1 隐式声明函数 copy from user 2 copy from user 缓冲区爆炸 一 定义 copy from user rwbuf buf count 作用 从用户空间复制到内核空间 c
  • 用switch语句实现简单的取款机程序

    大家好 今天给大家分享一个简单的取款机程序 相关函数 switch语句 分支语句 case语句 分支条件 break语句 结束循环 default语句 其他分支 演示效果 试试存款 存款成功 再试试取款 取款也成功 代码部分 源文件名 ma
  • Anaconda安装和激活

    一 Anaconda下载地址 https mirrors tuna tsinghua edu cn anaconda archive C M O D 说明 使用paddlepaddle需要先安装python环境 这里我们选择python集成
  • java判断平衡二叉树 - Kaiqisan

    大家好 都吃晚饭了吗 我是Kaiqisan 是一个已经走出社恐的一般生徒 今天还是二叉树的内容 首先明确一个概念 何为平衡二叉树 答 左子树和右子树高度差小于等于1 所以判断一个数是否为平衡二叉树的时候需要遍历所有的子树 因为概念的限制 即
  • Kafka Stream

    文章目录 一 Kafka Stream背景 1 Kafka Stream是什么 2 什么是流式计算 3 为什么要有Kafka Stream 二 Kafka Stream架构 1 Kafka Stream整体架构 2 Processor To
  • js判断对象数组中的元素是否存在重复

    1 使用 Array some 方法和自定义比较函数 使用 Array some 方法遍历数组 对每个元素执行自定义的比较函数 比较函数使用 Array findIndex 方法来查找与当前元素相等且索引不同的元素 如果找到则表示存在重复元
  • Java笔试题

    精选30道Java笔试题解答 都是一些非常非常基础的题 是我最近参加各大IT公司笔试后靠记忆记下来的 经过整理献给与我一样参加各大IT校园招聘的同学们 纯考Java基础功底 老手们就不用进来了 免得笑话我们这些未出校门的孩纸们 但是IT公司
  • EasyExcel——多sheet、有合并单元格的excel导入

    EasyExcel 读Excel官方文档链接 maven依赖
  • 系统运维-Linux Mariadb数据库基本命令教程

    Mariadb 是MySQL数据库的一个分支 它与MySQL比较有更优的存储引擎 运行速度快等优势 实验环境 Rocky 9 0 本地yum 安装Mariadb yum install mariadb y 开启服务并设置一下自启动 syst
  • mysql常用命令

    1 显示所有数据库 show database 2 显示所有表 show tables 3 显示表结构 desc 表名 4 查询所有表 select from 表名 参考 1 MYSQL常用SQL命令 http hi baidu com g
  • 限制input输入符合规则的浮点数

    给指定的dom添加事件 col sm 2 min goods amount keydown function e return formatInput e 限制input输入符合规则的浮点数 param type e 键盘事件 param
  • sizeof,strlen-----关于两者的一些小题解

    思维导图 目录 做题先知 第一波题目 一维数组 第一波题目解答 第二波题目 2 1字符数组为 char arr a b c d e f 详细题解 第三波题目 字符数组 char arr abcdef 详细题解 第四波题目 char p ab
  • 用Typora+PicGo搞定多个平台发文和微信公众号排版

    文章目录 如何开启公众号写作新思路 1 本文概述 1 1 适用人群 1 2 阅读完本文你可以获得什么 1 3 你需要什么 1 4 原理 2 安装npm 3 注册码云Gitee 3 1 新建仓库 3 2 创建私人令牌 4 安装PicGo 4
  • 【数据挖掘】期末复习:ID3、DBSCAN、关联分析、离群点挖掘等

    文章目录 小题 一些要背 计算 大题 分类 ID3 C4 5 CART Gini系数 K近邻 ID3 C4 5 K近邻优缺点 分类评价 朴素贝叶斯 聚类 K means DBSCAN 一趟聚类算法 层次聚类 关联分析 离群点挖掘 OF1 O