推荐系统之ROC和AUC详解

2023-05-16

前言

这个绝对是重量级内容了，也是很基础的东西。对于模型来讲，不同的阈值会有不同的泛化能力，这时候，如果想比较两个模型的泛化能力，这个阈值的高低也会受到影响，所以就需要能够综合考虑着所有阈值下的模型的泛化性能，这样还可以使得模型适应与不同的任务，那这时候应该怎么评估模型呢？ ROC曲线是常用的工具。

在这里和我们前面说过的PR曲线是类似的（mAP）,但是在之前的PR 曲线中横纵坐标是查准率和查全率。但是在这里就换成了真正例率（TPR）和假正例率（FPR），这两个也是根据混淆矩阵来计算的，这里看不懂的可以去看看我之前的文章目标检测指标mAP详解。

1、PR曲线和ROC曲线的区别

首先来说一下ROC曲线的定义，先看一下下面的图：

在这里插入图片描述

真正例率TPR: 这个就是查全率，真实情况为正的样本中，模型预测为正的比例，公式 $\frac{1}{1+ 2 }$

正例率FPR: 这个就是真实情况为负的样本中，模型预测为正的比例，公式 $\frac{3}{3+4}$

这两个就是ROC曲线的横纵坐标了，那么为什么大家在推荐系统中不会使用PR曲线了呢？

这是因为在推荐系统中很容易发生正负样本不均衡的情况，相比PR曲线，ROC曲线有个特点就是，当正负样本的分布发生变化时， ROC曲线的形状能够基本保持不变，而P-R曲线的形状一般会发生剧烈的变化，这个特点让ROC曲线能够尽量降低不同测试集带来的干扰，更加客观的衡量模型本身的性能。很多实际问题中，正负样本的数量往往不均衡，比如计算广告中，正样本往往是负样本的1/10000，若选择不同的测试集，P-R曲线的变化就会非常大，而ROC曲线则能够更加稳定的反映模型的好坏，这也是为啥ROC曲线应用广泛的原因。当然，选择PR曲线还是ROC曲线还是应该因实际问题而定，如果希望更多的看到模型在特定数据集上的表现， PR曲线则能够更加直观的反映性能。在反欺诈场景下，假设正常用户为正类（设占比 99.9%），欺诈用户为负类（设占比 0.1%）。如果使用准确率评估，则将所有用户预测为正类即可获得 99.9%的准确率。这并不是一个很好的预测结果，因为欺诈用户全部未能找出。使用AUC评估，则此时FPR=1,TPR=1，对应的AUC=0.5 。AUC成功的指出了这并不是一个很好的预测结果。

2、AUC物理意义以及计算

AUC代表的肯定就是ROC曲线下的面积，但是它的真实代表含义是随机给定一个正样本和一个负样本，正样本预测分数大于负样本预测分数的概率。AUC越大，表示模型预测样本为正样本的概率比模型预测样本为负样本的概率大，书上说的样本预测排序质量的度量，与排序误差有紧密关系。如：AUC=0.8表示：给定一个正样本和一个负样本，在 80% 的情况下，模型对正样本预测为正类的概率大于对负样本预测为正类的概率。（将正样本排在负样本前面的概率）。所以在正负样本不均衡的地方AUC仍然适用。

其中AUC的好处还有如下所示：

使用精确率，召回率和F1值进行模型评估时需要设定阈值，阈值的大小会影响模型的泛化能力，使用AUC评估模型性能时可以不设定阈值；
AUC计算主要与排序有关，它对排序敏感，而对预测分数没那么敏感（排序结果更重要，不管预测值是多少，只要正例的预测概率都大于负例就行，将预测概率同乘以1.2，AUC值不变）
在一定条件下，RankBoost算法优化的全局函数就是AUC，可以使用RankBoost算法优化AUC的近似值或对AUC进行局部优化。（paper）；xgboost提供了直接优化AUC的功能，目标函数设置为：objective = ‘rank:pairwise’。
当正负样本的分布发生变化时，P-R曲线的形状一般会发生比较剧烈的变化，而ROC曲线的形状能够基本保持不变。这使得ROC曲线能够尽量降低不同测试集带来的干扰，更加客观地衡量模型本身的性能。

代码：

def auc(y_label, y_pred):
	
	n = len(y_label)
	pos_pred = [y_pred[i] for i in range(n) if y_label[i] == 1]
	neg_pred = [y_pred[i] for i in range(n) if y_label[i] == 0]
	n_pos = len(pos_pred)   # 正样本的个数
	n_neg = len(neg_pred)   # 负样本的个数
	auc = 0
	# 对任一一对pair， 正 > 负的pair个数除以pair对的总数就是auc
	for i in range(n_pos):
		for j in range(n_neg):
			if pos_pred[i] > neg_pred[j]:
				auc += 1
			elif pos_pred[i] == neg_pred[j]:
				auc += 0.5
	
	return auc / (n_pos * n_neg)



def auc(y_label, y_pred):
	# 先按照预测概率从小到大排序，然后找正样本所在的索引值
	n_pos = sum(y_label)
	n_neg = len(y_label) - n_pos
	label_pred = list(zip(y_label, y_pred))
	label_pred.sort(key=lambda x: x[1])   # 按照概率从小到大排序
	
	pos_label_index_acc = 0
	for i, (label, pred) in enumerate(label_pred):
		if label == 1:
			pos_label_index_acc += i
	
	acc_1_m = n_pos * (n_pos - 1) / 2
	return (pos_label_index_acc - acc_1_m) / (n_pos * n_neg)

参考：翻滚的小强

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

随机推荐

训练时的Batchsize和Epoch之间的区别是什么？

阅读这篇文章后 xff0c 你会知道 xff1a 随机梯度下降是一种迭代学习算法 xff0c 它使用训练数据集来更新模型批量大小是梯度下降的超参数 xff0c 在模型的内部参数更新之前控制训练样本的数量 Epoch数是梯度下降的超参数 x
如何在ROS下向ROS_PACKAGE_PATH中添加路径来解决找不到包的情况

如果在创建ROS工作空间时不是严格按照 mkdir p catkin ws src 来创建的话可能后面会出现找不到包的情况 xff0c 这个时候你用命令 echo ROS PACKAGE PATH 会发现所找不到的包没有包含在这个路径里面
移动平均法又称滑动平均法、滑动平均模型法（Moving average，MA）

转自http jingji 100xuexi com view otdetail 20130625 230f09b0 6e36 473b 8830 7f2b873a5252 html 什么是移动平均法移动平均法是用一组最近的实际数据值来预
C/C++ 数学库文件 (math.h)

目录 1 三角函数 Trigonometric functions 1 1 cos 函数 1 2 sin 正弦函数 1 3 tan 正切函数 1 4 acos 反余弦函数 1 5 asin 反正弦函数 1 6 atan 反正切函数 1 7
C语言进阶 ~ 内存四区（栈、堆、全局、代码区）

特别声明 xff1a 该部分是根据B站大佬什么都想干好的视频学习而来目录 1 1 数据类型本质分析 1 1 1 数据类型概念 1 1 2 数据类型的本质 1 1 3 数据类型的别名 1 1 4 数据类型之 void 1 2 变量的本质分
C语言进阶 ~ 一级指针与字符串

目录 2 1 指针强化 2 2 一级指针 char 易错地方 2 2 1 对空字符串和非法字符串的判断 2 2 2 越界 2 2 3 指针的叠加会不断改变指针的方向 2 2 4 局部变量不要外传 2 2 5 函数内使用辅助变量的重要性 2
STC51从入门到精通（汇编）~~~ 第八讲：串行通信技术

目录 8 1 80C51单片机串行通信技术的特点 8 2 串行通信基本知识 8 2 1 数据通信 8 2 2 串行通信的传输方式 8 2 3 异步通信和同步通信 8 3 串行接口的组成和特性 8 3 1 串行口的结构 8 3 2 串行口控制
基于arduino的循迹小车（含有PID算法）

循迹小车一般分为两方面 xff1a 一方面是简单的闭环赛道只有直道和弯道 xff0c 另一方面是毕设类型的包括一些元素 xff1a 90度弯道十字道路 S形弯道等 1 CSDN下载 xff1a 含有PID xff1a https down
基于手机蓝牙的arduino遥控小车

遥控小车是每个人童年的最爱 xff0c 不仅好奇它的奇妙 xff0c 更是喜欢它带来的刺激小编为大家带来几篇博客 xff0c 来给大家讲讲制作遥控小车的程序看大标题可知我们一共有五个方法去制作一款带有遥控功能的小车 xff0c 小编分开
课程设计题四：LED彩灯控制器设计

要求 xff1a 1 至少10个发光管4种花样自动变换 xff0c 循环往复 2 彩灯花样变换的快慢节拍可以手动和自动方式控制 xff0c 手动控制按钮按一次转换一次 xff1b 自动控制方式每15秒变换一次 xff0c 1分钟循环一遍 3
PyCharm 调试Debug入门

为了摈弃print的暴力调试法 xff0c 在mentor的耳濡目染下 xff0c 我开始了PyCharm的Debug 例程 xff1a def helloworld print 39 hello world 39 a 61 1 b 61
树莓派自带SSH server，但默认关闭，需手动开启ssh

命令行输入sudo raspi config 选择Interfacing Options 选择SSH项 enable
Ubuntu 18.04 ——— VINS-Fusion运行与EVO的评测与使用

Ubuntu 18 04 VINS Fusion运行与EVO的评测与使用一运行环境搭建1 VINS Fusion安装1 创建ros工作空间2 编译VINS Fusion 2 EVO安装3 数据集二 VINS Fusion运行1 单相机
Deep Learning 最优化方法之Momentum（动量）

本文是Deep Learning 之最优化方法系列文章的Momentum xff08 动量 xff09 方法主要参考Deep Learning 一书整个优化系列文章列表 xff1a Deep Learning 之最优化方法 Deep
VINS-Mono代码详解 ——— （0）原理框图 + ROS 基础知识 + 代码目录图

VINS Mono代码详解 xff08 0 xff09 原理框图与代码流程图一 VINS原理图1 前端 xff08 数据预处理 xff09 2 后端 xff08 滑窗优化 xff09 3 初始化4 闭环二 ROS 基础知识1 运行VIN
C++Primer第五版 ——— （ch2）课后习题参考答案

C 43 43 Primer第五版 xff08 ch2 xff09 课后习题参考答案练习 2 1练习 2 2练习 2 3练习2 5练习2 6练习2 72 8 练习练习 2 9练习 2 10练习 2 11练习 2 12练习 2 13练习 2
Ubuntu 18.04 ———（Intel RealSense D435i）标定后结果用于VINS-Fusion

Ubuntu 18 04 xff08 Intel RealSense D435i xff09 标定后结果用于VINS Fusion 一相机内外参1 什么是相机内外参 xff1f 2 如何获得相机标定前的内参 xff1f 3 如何把标定参数
C语言——全局变量在多个.c文件中共用

全局变量可以定义在一个 c文件中 xff0c 变量存储在静态存储区 xff0c 变量可以被其他文件中的函数使用 xff0c 变量的作用范围是整个程序 xff0c 全局变量可以再被使用过的地方改变数值当定义了全局变量的时候 xff0c 在其
JavaScript中的防抖和节流

防抖 debounce 触发高频事件后 n秒内函数只执行一次如果n秒内高频事件再次触发 xff0c 则重新计算事件防抖场景 xff1a 1 登录发短信等按钮避免用户点击太快 xff0c 以至于发送多次请求 xff0c 需要防抖 2
推荐系统之ROC和AUC详解

前言这个绝对是重量级内容了 xff0c 也是很基础的东西对于模型来讲 xff0c 不同的阈值会有不同的泛化能力 xff0c 这时候 xff0c 如果想比较两个模型的泛化能力 xff0c 这个阈值的高低也会受到影响 xff0c 所以就需要

推荐系统之ROC和AUC详解

前言

1、PR曲线和ROC曲线的区别

2、AUC物理意义以及计算

推荐系统之ROC和AUC详解 的相关文章

随机推荐

热门标签

推荐系统之ROC和AUC详解的相关文章