• 数据可视化和数据降维 4个主题 直方图2多维的问题3PCA4T SNE 可视化 Histograms直方图 直方图用来统计数据在不同区间出现的次数 高维数据 特征很多的数据 e g 如病人病历包含 姓名 年龄 性别 血压 血糖 等 数据量为
  • Lec1 5 31 目标 学习多种数据分析算法和技巧 数据分析应用 期中 project 期末 术语区别 数据科学是领域 统计分析是数学子学科 ML是让电脑自己通过数据和经验改进算法 AI是一种模仿人类的ML 数据挖掘 是处理数据然后发现模
  • ML的基础框架 1定义要解决的问题 2构建数据集 3数据变换 4训练模型 5使用模型预测 example 垃圾邮件标记系统来解释术语 Dataset 一堆的邮件 Sample Instances 一封邮件 Feature Variables