1.召回率、准确率、ROC曲线、AUC、PR曲线这些基本概念
这个是今天的重点,传统机器学习里面也是很重要的一点,刚好可以重新学习一下,像AUC其实它就是一个用来评判你的一个模型的准确率的,因为在普通的正确率中,会因为样本的不平衡,而正确率也会跟着改变受到影响!
今天就来彻底搞懂什么是AUC,什么是ROC
1.性能度量:
机器学习要建模,而对于一个模型的好坏也就是对于判定一个模型的泛化能力,我们需要用什么去评判它的泛化能力了,这里就用到了性能度量,它就相当于一个指标。有了指标,我们就能对比不同的模型,从而去判断模型的好坏。而AUC/ROC就是用于分类的指标(性能度量)
2.混淆矩阵:
如果我们是二分类模型,我们将预测结果于实际结果两两混合,会出现4种情况,这就是所谓的混淆矩阵。
由于1和0阅读性不高,