一、数据挖掘是什么?
从技术层面讲,数据挖掘指从大量数据中提取潜在有用的信息和知识的过程。
从商业层面讲,数据挖掘是一种对大量业务数据进行抽取、转换、分析和建模处理,并从中提取辅助商业决策的关键数据的商业信息处理技术。
二、数据挖掘与传统传统数据分析方法的区别
传统的数据分析方法是例如查询、报表、联机应用分析等的分析方法
数据挖掘得到的信息具有三个基本特性:先前未知、有效、实用。
数据挖掘的主要目标是:提高决策能力,能在过去的经验基础上预言未来的趋势等。
数据挖掘与传统分析方法本质上的区别是:数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识的;而传统分析方法则是对现有数据进行有明确要求的数据分析处理
三、数据挖掘的对象
(1)关系数据库
(2)数据仓库
数据仓库:面向主题的、集成的、相对稳定的、反应历史变化的数据集合
用途:用于支持管理决策,联机分析处理
(3)事务数据库
通常,每个纪录代表一个事务,一个事务由唯一的标识号和组成该事物的项目列表组成
(4)空间数据库
空间数据库是指在关系型数据库内部对地理信息进行物理存储
存储的数据:对象的空间拓扑特征、非空间属性特征、对象在时间上的变化
常见数据类型:地理信息系统、遥感图像数据、医学图像数据
特点:数据量庞大、空间数据模型复杂、属性数据和空间数据联合管理,应用范