【深度学习】计算分类模型的分类指标，计算accuracy_top-1、accuracy_top-5、precision、recall和f1_score

2023-05-16

在这里插入图片描述

计算accuracy_top-1、accuracy_top-5、precision、recall和f1_score：

（1）accuracy_top-1
np.sum(np.argmax(preds, axis=1) == np.argmax(actual, axis=1)) / actual.shape[0]
accuracy_top-1指标是假设预测数据中，最大值的index就是预测出来的样本类别，从而看一下总共预测正确了多少个样本，再除以总数量即是accuracy_top-1指标。

（2）accuracy_top-5
np.sum(np.argsort(preds, axis=1)[:, -1:-5:-1] == np.argmax(actual, axis=1).reshape(-1, 1)) / actual.shape[0]
和accuracy_top-1类似，也是先将预测出的多个概率值排序，但取最大的五个的index，只要有一个index能对上真实的label，那就是预测准确。预测正确的样本数再除以总数量即是accuracy_top-1指标。
有个风险是，有时候类别数量小于5，这样怎么算accuracy_top-5的数值都会是100%。

（3）precision、recall、f1_score
这都是在引入threshold 数值之后才能计算的。
precision = tp / (tp + fp) # 预测正确数量/所有的预测数量
recall = tp / (tp + fn) # 预测正确数量/所有的实际数量
f1_score = 2 * precision * recall / (precision + recall)

“所有的预测数量” 和 “所有的实际数量” 都不是我们的总样本数量，当一个样本输入模型，模型的结果中，如果几个类别的预测值都小于预测值，那么这个样本就不会纳入到这里“precision、recall或f1_score”的计算。

那么Why？因为我们是在评估模型的方面的指标，评估模型的指标就是这样计算。而总样本数量不会影响模型的指标，但是会影响模型的泛化性能。

下面的程序中，构建好实际labels和预测preds，即可计算出所有指标：

import numpy as np

n_samples = 10000  # 假设总样本个数
cls_n = 6  # 假设模型类别个数
threshold = 0.5   # 阈值


# n_samples行，6列，每一行只有一个数字是1
actual = np.zeros((n_samples, cls_n))
actual[np.arange(n_samples), np.random.randint(0, cls_n, n_samples)] = 1

# 7个样本是7行, 6个类别是6列
# 高斯分布
preds = np.random.randn(n_samples, cls_n)
sums = preds.sum(axis=1)  # 求每行的和
preds /= sums[:, None]  # 每行除以自己的和

# 计算accuracy_top-1
top1_acc = np.sum(np.argmax(preds, axis=1) == np.argmax(actual, axis=1)) / actual.shape[0]
print("accuracy_top-1", top1_acc)

# 计算accuracy_top-5
top5_acc = np.sum(np.argsort(preds, axis=1)[:, -1:-5:-1] == np.argmax(actual, axis=1).reshape(-1, 1)) / actual.shape[0]
print("accuracy_top-5", top5_acc)

# 计算各个类别precision, recall和f1 score
for i in range(actual.shape[1]):
    tp = np.sum(np.logical_and(preds[:, i] >= threshold, actual[:, i] == 1))
    fp = np.sum(np.logical_and(preds[:, i] >= threshold, actual[:, i] == 0))
    fn = np.sum(np.logical_and(preds[:, i] < threshold, actual[:, i] == 1))
    if tp == 0 or tp + fp == 0:
        precision = 0
    else:
        precision = tp / (tp + fp)  # 预测正确数量/所有的预测数量
    if tp == 0 or tp + fn == 0:
        recall = 0
    else:
        recall = tp / (tp + fn)  # 预测正确数量/所有的实际数量
    if precision + recall == 0:
        f1_score = 0
    else:
        f1_score = 2 * precision * recall / (precision + recall)
    print("class", i, "precision", round(precision, 4), "recall", round(recall, 4), "f1_score", round(f1_score, 4))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

【深度学习】计算分类模型的分类指标，计算accuracy_top-1、accuracy_top-5、precision、recall和f1_score 的相关文章

单精度浮点无法表示的最小整数

所以我知道单精度浮点不能表示的最小正整数是2 23 1 1 16 777 217 我们如何知道我们使用 2 23 1 1 我知道有一个隐含的 1 而 23 是尾数中表示的位数但为什么会这样呢我们怎么知道我们使用 2 23 1 1 IEE
使用 .* 宽度说明符调用 sprintf 时出现奇怪警告

对于以下代码 https godbolt org z WcGf9hEs3 https godbolt org z WcGf9hEs3 include
seq 和 == 运算符的神秘行为。精度问题？

我遇到了该函数的某种奇怪或只是出乎意料的行为seq 创建简单序列时某些值无法与运算符正确匹配看这个最小的例子 my seq lt seq 0 0 4 len 5 table my seq ok returns 0 0 1 0 2
在 Mathematica 中写入文件时格式化数字

这是一个延续this https stackoverflow com q 4943706 181759关于数字格式的问题与我之前的相关question https stackoverflow com q 1687705 181759关于获
iOS 中 UITouch 时间戳的精度是多少？

iOS 中 UITouch 类的时间戳属性有多精确毫秒几十毫秒我正在将 iPad 的内部测量值与贴在屏幕上的自定义触摸检测电路进行比较发现两者之间存在相当大的差异标准偏差约 15 毫秒我已经看到它建议时间戳根据帧刷新间隔进行离散
“可能会损失精度”是 Java 发疯了还是我遗漏了一些东西？

AFAIK 当我不应该出现精度损失错误时我却收到了精度损失错误这是一个实例变量 byte move 0 这发生在此类的方法中 this move this move lt lt 4 byte Guy moven indexOf
Chrome 中的 Math.log2 精度已更改

我编写了一个 JavaScript 程序它根据元素的数量计算二叉树的深度我的程序几个月来一直运行良好但最近我发现在 Chrome 和 Firefox 中查看网页时存在差异特别是在 Firefox 上 Math log2 8 3 但现
Jooq 将 String 转换为 BigDecimal

有没有办法在 jooq 查询中将 String 转换为 BigDecimal 而不丢失精度当我做endResER VALUE cast BigDecimal class where VALUE是数据库中具有字符串值的字段它返回不带任何小
Java 精确计算 - 使用选项

我试图对 JAVA SQL 中精确计算的选项进行一些简洁的概述到目前为止我找到了以下选项使用双打接受他们的缺点不行 use BigDecimals 在复杂的公式中使用它们对我来说是有问题的 use String format De
Python“decimal”包给出错误的结果

我尝试通过设置来计算以下内容getcontext prec 800 gt gt gt from decimal import gt gt gt getcontext prec 800 gt gt gt Decimal 22 0 Decima
ValueError：cross_val_predict仅适用于分区

我有一个包含特征数组 X 和因变量数组 y 的多类分类问题 y 有四个类 1 2 3 和 4 数据严重不平衡第 4 类只有少数观察结果我选择的分类器模型为 model RandomForestClassifier n estimator
在matlab中设置图例符号的精度

我有这个 leg2 strcat Max Degree num2str adet 1 1 ch l leg3 strcat Min Degree num2str adet 1 2 ch l leg4 strcat Max Request n
在java中以一定精度显示双精度数

我目前正在编写一个计算器应用程序我知道双精度数并不是良好数学的最佳选择应用程序中的大多数函数都具有很高的精度但有些函数不会得到非常难看的结果我的解决方案是只向用户显示 12 位小数的精度我选择 12 是因为我的最低精度来自我的数值
Keras 服装回调。生成精确召回时，我在 _flow_index 中收到错误

我正在使用 Keras 训练二元分类器我想在每个时期后生成 precision score 和 recall score 以便更深入地分析训练在互联网上我找到了教程帮助例如 https medium com thongonary h
Java 和 SQL Server 中的精度噩梦

我一直在与 Java 和 SQL Server 中的精确噩梦作斗争直到我不再知道了就我个人而言我理解这个问题及其根本原因但向地球另一端的客户解释这一点是不可行的至少对我来说情况是这样的我在 SQL Server 中有两列 Qt
scala.math.BigDecimal ：1.2 和 1.20 相等

将 Double 或 String 转换为 scala math BigDecimal 时如何保持精度和尾随零用例在 JSON 消息中属性的类型为 String 值为 1 20 但是在 Scala 中读取这个属性并将其转换为 BigD
GLSL 中统一浮点行为和常量浮点行为的不同

我正在尝试在 GLSL 中实现模拟双精度并且观察到一种奇怪的行为差异导致 GLSL 中出现细微的浮点错误考虑以下片段着色器写入 4 浮点纹理以打印输出 layout location 0 out vec4 Output unifor
这些双精度值如何精确到小数点后 20 位？

当精度是一个问题时我正在测试一些非常简单的等价错误并希望以扩展双精度执行操作这样我就知道答案在 19位数字中然后以双精度执行相同的操作其中第 16 位会有舍入误差但不知何故我的双精度算术保持了 19 位精度当我在扩展双精度中
python中计算最小范数解或从伪逆得到的解最准确的方法是什么？

我的目标是解决 Kc y 与伪逆即最小范数解 c K y 这样模型希望是高次多项式模型f x sum i c i x i 我对不确定的情况特别感兴趣在这种情况下我们拥有比数据更多的多项式特征方程很少变量未知数太多 colum
16 位、32 位和 64 位 IEEE-754 系统可以表示什么范围的数字？

我对浮点数的表示方式有所了解但恐怕还不够一般问题是对于给定的精度就我的目的而言以 10 为基数的精确小数位数 16 位 32 位和 64 位 IEEE 754 系统可以表示什么范围的数字具体来说我只对精确到 0 5 个位或

随机推荐

Linux内核实现ns级别定时器及应用层实现us级高精度定时

内核态ns us定时器内核态常规实现精准定时器再linux2 6版本提出hrtime模块能达到ns级别精准定时实现方法如下 xff08 内核hrtime为我们提供了创建与运行接口 xff09 xff1a include lt linux
链表逆序操作C++版本

链表逆序操作 xff1a 步骤如下 xff1a 首先先记住当前节点的下一个节点的位置 xff0c 因为如果将该节点插入至新节点 xff0c 需要改变它的next指向然后 xff0c 将当前节点的next指向newhead指向的节点最后 xf
JS模块化——02——common.js

浏览器有时候识别es5的语法 xff0c 而我们写代码时写的是es6语法 xff0c 所以要打包这样能转换成es5的代码 1 commonjs基于服务端 node 应用结合引入第三方模块小案例 package json中name是包名
POJ 3259 Wormholes（负权环路）

题意 xff1a 农夫约翰农场里发现了很多虫洞 xff0c 他是个超级冒险迷 xff0c 想利用虫洞回到过去 xff0c 看再回来的时候能不能看到没有离开之前的自己 xff0c 农场里有N块地 xff0c M条路连接着两块地 xff0c W
PaddleOCR 文字检测/文字块检测的模型训练过程，DBnet的前处理和后处理流程损失函数

文章目录 1 环境搭建2 数据集3 下载预训练模型4 配置文件DecodeImageDetLabelEncodeIaaAugmentEastRandomCropDataMakeBorderMap 5 开启训练6 纯记录 xff0c 我在我服
手机的散热背夹的物理原理

可能使用了以下一些技术原理 xff1a xff08 1 xff09 利用导热材料 xff1a 通过在散热背夹中采用高导热率的材料 xff0c 如铜或铝等 xff0c 将手机产生的热量快速传递到散热背夹中 xff0c 从而降低手机温度 xff
【算法题目】【Python】彻底刷遍DFS与回溯的算法题目

文章目录参考资料热身 xff1a 树的前序中序后序遍历热身 xff1a 树的层次遍历纯DFS与回溯法的区别纯DFS与回溯法的算法题目组合组合总和 III电话号码的字母组合组合总和组合总和 II分割回文串复原 IP 地址子集子集 II递
【算法题目】使用Python生成一个数独游戏的棋盘

难度可以控制 xff0c 且解法唯一 xff0c 时间复杂度看运气首先 xff0c 我们定义了一个 SudokuGenerator 类然后 xff0c 我们定义了 generate 方法来生成数独游戏该方法生成了一个 9 9 的矩阵
【算法题目】【Python】一文刷遍贪心算法题目

文章目录介绍分配饼干K 次取反后最大化的数组和柠檬水找零摆动序列单调递增的数字买卖股票的最佳时机 II买卖股票的最佳时机含手续费分发糖果根据身高重建队列跳跃游戏跳跃游戏 II用最少数量的箭引爆气球无重叠区间划分字母区间介绍贪心算法是一
following signatures couldn‘t be verified because the public key is not available: NO_PUBKEY

the following signatures couldn t be verified because the public key is not available NO PUBKEY 3B4FE6ACC0B21F32 This er
【运维】Linux中的常用的一些文件和作用

bin xff1a 包含系统启动和基本维护所需的二进制可执行文件 boot xff1a 包含用于系统引导的文件 xff0c 包括内核文件和引导加载程序 dev xff1a 包含与设备相关的文件 xff0c 如硬盘驱动器键盘等 etc xf
【C++】GCC编译过程与目标文件类别

书籍下载 xff1a 程序员的自我修养 xff1a 链接装载与库 pdf 经典技术书籍 GCC编译过程预编译 prepressing xff0c 将cpp hpp转为 i 结尾的文件 xff1b 编译 compilation汇编 ass
【深度学习】ONNX 模型文件修改节点的名称，修改输入名称，修改输出名称

想要修改onnx模型文件的节点名称 xff0c 要么在最初的pytorch代码里去改 xff0c 要么就直接在onnx模型文件里改而我这里直接在onnx模型文件改 xff0c 我有一个onnx文件 xff0c 输出节点的名字是这样的 xf
【运维】move mv文件过多，/usr/bin/mv: Argument list too long，解决方案

使用 xff1a span class token function ls span 1 文件名 span class token operator span span class token function awk span span
C++排序函数中cmp()比较函数详解

整型数据比较 bool cmp int span class hljs literal a span int b span class hljs keyword return span span class hljs literal a s
HX711 不同压力传感器的不同GapValue数值

5kg 10kg 20kg 接线方法都是如下 xff1a 5kg的GapValue xff1a span class token comment 校准参数 span span class token comment 因为不同的传感器特性曲线
【Python】Python程序中使用request库连接外国网站的方法

确认你的socks端口 xff1a 然后程序可以这么写 xff1a span class token keyword import span requests span class token keyword import span soc
【OpenCV】opencv中的模糊方法使用

opencv中的模糊方法使用 span class token keyword import span cv2 span class token keyword import span numpy span class token keyw
使用C语言计算两个日期之间间隔了多少分钟的程序

使用C语言计算两个日期之间间隔了多少分钟的方法 xff1a 默认计算2000年之后的 xff0c 否则请改一下year afer2000 那个地方默认计算间隔了多少分钟 xff0c 若要计算秒钟 xff0c 需要对应修改一下整体 span
【深度学习】计算分类模型的分类指标，计算accuracy_top-1、accuracy_top-5、precision、recall和f1_score

计算accuracy top 1 accuracy top 5 precision recall和f1 score xff1a xff08 1 xff09 accuracy top 1 np sum np argmax preds axis

【深度学习】计算分类模型的分类指标，计算accuracy_top-1、accuracy_top-5、precision、recall和f1_score

【深度学习】计算分类模型的分类指标，计算accuracy_top-1、accuracy_top-5、precision、recall和f1_score 的相关文章

随机推荐

热门标签