Top-1错误率、Top-5错误率等常见的模型算法评估指标解析

2023-11-04

Top-1 错误率：指预测输出的概率最高的类别与人工标注的类别相符的准确率，就是你预测的label取最后概率向量里面最大的那一个作为预测结果，如过你的预测结果中概率最大的那个分类正确，则预测正确，否则预测错误。比如预测100张图像的类别，每张图像的最高概率错误的有2张，那么top-1为2%；

Top-5 错误率：指预测输出的概率最高的前5个类别，就是最后概率向量最大的前五名中，只要出现了正确概率（与人工标注类别一致）即为预测正确，否则预测错误。比如预测100张图像的类别，每张图像前5个最高概率类别中没有一个正确时的张数有3张，那么top-5错误率为3%；

Top-1 错误率是指概率最大的预测结果不在正确标签中的概率。
Top-5 错误率是指概率前五的预测结果不在正确标签中的概率。

计算公式如下：

TOP-1 正确率 =（所有测试图片中正确标签包含在最高分类概率中的个数）除以（总的测试图片数）
TOP-1 错误率 =（所有测试图片中正确标签不在最高分类概率中的个数）除以（总的测试图片数）
TOP-5 正确率 =（所有测试图片中正确标签包含在前五个分类概率中的个数）除以（总的测试图片数）
TOP-5 错误率 =（所有测试图片中正确标签不在前五个概率中的个数）除以（总的测试图片数）

代码实现：

# acc.py
import torch
def accu(output, target, topk=(1,)):
    """Computes the accuracy over the k top predictions for the specified values of k"""
    with torch.no_grad():
        maxk = max(topk)
        batch_size = target.size(0)
        _, pred = output.topk(maxk, 1, True, True)
        pred = pred.t()
        correct = pred.eq(target.view(1, -1).expand_as(pred))

        res = []
        for k in topk:
            correct_k = correct[:k].view(-1).float().sum(0, keepdim=True)
            res.append(correct_k.mul_(100.0 / batch_size))
        return res

# torch.topk(input, k, dim=None, largest=True, sorted=True, out=None) -> (Tensor, LongTensor)
# input：输入张量
# k：指定返回的前几位的值
# dim：排序的维度
# largest：返回最大值
# sorted：返回值是否排序
# out：可选输出张量

# 注：如需要top-3，可将上述代码（acc.py）改为 output.topk( , 3, , )以及对应的train代码里面改topk=(3, )。

# train.py
# 计算Top1
                pred1_train, pred2_train = accu(outputs, lables, topk=(1, ))
                train_top1.update(pred1_train[0], val_images.size(0))
                #train_top2.update(pred2_train[0], val_images.size(0))
                t_top1 = train_top1.avg
                #t_top2 = train_top2.avg
# 打印结果
print('[epoch %d] train_loss: %.3f  test_loss: %.3f val_accuracy: %.3f top1: %.4f' %
              (epoch + 1, running_loss / train_steps, testing_loss / test_steps , val_accurate, t_top1))

class AverageMeter(object):
    def __init__(self):
        self.reset()

    def reset(self):
        self.val = 0
        self.avg = 0
        self.sum = 0
        self.count = 0

    def update(self, val, n=1):
        self.val = val
        self.sum += float(val) * n
        self.count += n
        self.avg = self.sum / self.count

参考博文：学习笔记30-Top1和Top5定义与代码复现_李卓璐的博客-CSDN博客

机器学习的监督学习中，为了方便绘制和展示，我们常用表格形式的混淆矩阵（Confusion Matrix）作为评估模式。这在无监督学习中一般叫做匹配矩阵。

True Positive（TP）：预测为正例，实际为正例，即算法预测正确（True）

False Positive（FP）：预测为正例，实际为负例，即算法预测错误（False）

True Negative（TN）：预测为负例，实际为负例，即算法预测正确（True）

False Negative（FN）：预测为负例，实际为正例，即算法预测错误（False）

① Accuracy：准确率，指的是正确预测的样本数占总预测样本数的比值，它不考虑预测的样本是正例还是负例，反映的是模型算法整体性能，其公式如下：

② Precision：精确率，指的是正确预测的正样本数占所有预测为正样本的数量的比值，也就是说所有预测为正样本的样本中有多少是真正的正样本，它只关注正样本，这是区别于Accuracy的地方，其公式如下：

③ F1-Score：F1分数，是统计学中用来衡量二分类模型精确度的一种指标，它被定义为精确率和召回率的调和平均数，它的最大值是1，最小值是0，其公式如下：

即：

④ Recall：召回率，指的是正确预测的正样本数占真实正样本总数的比值，也就是指能从这些预测样本中能够正确找出多少个正样本，其公式如下：

⑤ TPR（True Positive rate）：真阳率，指的是在所有实际为阳性的样本中，被正确地判断为阳性的比率，同召回率，其公式如下：

⑥ FPR（False Positive rate）：假阳率，指的是在所有实际为阴性的样本中，被错误地判断为阳性的比率，其公式如下：

⑦ ROC（Receiver Operating Characteristic）：受试者工作特征曲线，其以FPR假阳率为X轴坐标，以TPR真阳率为Y轴坐标，曲线越靠近左上角则说明模型算法性能越好。

⑧ AUC（Area Under Curve）：ROC曲线下的面积，模型通常对应于其对角线，通常AUC的值范围为0.5~1，其值越大说明模型算法的性能越好，AUC为0.5时模型算法为“随机猜测”，其值为1时说明模型算法达到理想状态。通常我们可以使用sklearn.metrics.auc(fpr, tpr)来求得AUC值。

⑨ PRC（Precision-Recall Curve）：精准率-召回率曲线也叫PR曲线，其以Recall为X轴坐标，以Precision为Y轴坐标，通过对模型算法设定不同的阈值会得到不同的precision和recall值，将这些序列绘制到直角坐标系上就得到了PR曲线，PR曲线下的面积为1时则说明模型算法性能最为理想。

⑩ IOU（Intersection over Union）：交并比，目标检测模型中常用的指标，指的是ground truth bbox与predict bbox的交集面积占两者并集面积的一个比率，IoU值越大说明预测检测框的模型算法性能越好，通常在目标检测任务里将 IoU>=0.7 的区域设定为正例（目标），而将IoU<=0.3的区域设定为负例（背景），其余的会丢弃掉，形象化来说可以用如下图来解释IoU：

如果我们用A表示ground truth bbox的面积，B表示predict bbox的面积，而I表示两者的交集面积，那么IoU的计算公式如下：

pytorch中的IOU值计算：

def box_area(boxes):
    return (boxes[:, 2] - boxes[:, 0]) * (boxes[:, 3] - boxes[:, 1])


def box_iou(boxes1, boxes2):
    area1 = box_area(boxes1)
    area2 = box_area(boxes2)

    lt = torch.max(boxes1[:, :2], boxes2[:, :2]) 
    rb = torch.min(boxes1[:, 2:], boxes2[:, 2:])  

    wh = rb - lt 
    inter = wh[:, 0] * wh[:, 1]

    iou = inter / (area1 + area2 - inter)
    return iou

⑪ AP（Average Percision）：AP为平均精度，指的是所有图片内的具体某一类的PR曲线下的面积，其计算方式有两种，第一种算法：首先设定一组recall阈值[0, 0.1, 0.2, …, 1]，然后对每个recall阈值从小到大取值，同时计算当取大于该recall阈值时top-n所对应的最大precision。这样，我们就计算出了11个precision，AP即为这11个precision的平均值，这种方法英文叫做11-point interpolated average precision；第二种算法：该方法类似，新的计算方法假设这N个样本中有M个正例，那么我们会得到M个recall值（1/M, 2/M, …, M/M）,对于每个recall值r，该recall阈值时top-n所对应的最大precision，然后对这M个precision值取平均即得到最后的AP值。

⑫ mAP（Mean Average Percision）：mAP为均值平均精度，指的是所有图片内的所有类别的AP的平均值，目前，在目标检测类里用的最多的是mAP，一般所宣称的性能是在IoU为0.5时mAP的值。

⑬ MAE（Mean Absolute Error）：平均绝对误差，对于回归预测类，其能更好地反映预测值与真实值误差的实际情况，其计算公式如下：

⑭ RMSE（Root Mean Square Error）：均方根误差，用于衡量观测值与真实值之间的偏差，其对一组预测中的特大或特小误差反映比较敏感，常用来作为机器学习模型预测结果衡量的标准，其计算公式如下：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Top-1错误率、Top-5错误率等常见的模型算法评估指标解析的相关文章

使用 KL 散度时，变分自动编码器为每个输入 mnist 图像提供相同的输出图像

当不使用 KL 散度项时 VAE 几乎完美地重建 mnist 图像但在提供随机噪声时无法正确生成新图像当使用 KL 散度项时 VAE 在重建和生成图像时都会给出相同的奇怪输出这是损失函数的 pytorch 代码 def loss fu
为什么 RNN 需要两个偏置向量？

In Pytorch RNN 实现 http pytorch org docs master nn html highlight rnn torch nn RNN 有两个偏差 b ih and b hh 为什么是这样它与使用一种偏差有什么
一次热编码期间出现 RunTimeError

我有一个数据集其中类值以 1 步从 2 到 2 i e 2 1 0 1 2 其中 9 标识未标记的数据使用一种热编码 self one hot encode labels 我收到以下错误 RuntimeError index 1 is
在非单一维度 1 处，张量 a (2) 的大小必须与张量 b (39) 的大小匹配

这是我第一次从事文本分类工作我正在使用 CamemBert 进行二进制文本分类使用 fast bert 库该库主要受到 fastai 的启发当我运行下面的代码时 from fast bert data cls import Bert
PyTorch：如何检查训练期间某些权重是否没有改变？

如何检查 PyTorch 训练期间某些权重是否未更改据我了解一种选择可以是在某些时期转储模型权重并检查它们是否通过迭代权重进行更改但也许有一些更简单的方法有两种方法可以解决这个问题 First for name param in
PyTorch 中复数矩阵的行列式

有没有办法在 PyTorch 中计算复矩阵的行列式 torch det未针对 ComplexFloat 实现不幸的是目前尚未实施一种方法是实现您自己的版本或简单地使用np linalg det 这是一个简短的函数它计算我使用 LU
Pytorch ValueError：优化器得到一个空参数列表

当尝试创建神经网络并使用 Pytorch 对其进行优化时我得到了 ValueError 优化器得到一个空参数列表这是代码 import torch nn as nn import torch nn functional as F fro
Pytorch Tensor 如何获取元素索引？ [复制]

这个问题在这里已经有答案了我有 2 个名为x and list它们的定义如下 x torch tensor 3 list torch tensor 1 2 3 4 5 现在我想获取元素的索引x from list 预期输出是一个整数 2
Pytorch“展开”等价于 Tensorflow [重复]

这个问题在这里已经有答案了假设我有大小为 50 50 的灰度图像在本例中批量大小为 2 并且我使用 Pytorch Unfold 函数如下所示 import numpy as np from torch import nn from
预期设备类型为 cuda 的对象，但在 Pytorch 中获得了设备类型 cpu

我有以下计算损失函数的代码 class MSE loss nn Module metric L1 L2 norms or cosine similarity mode training or evaluation mode def init
PyTorch 中的连接张量

我有一个张量叫做data形状的 128 4 150 150 其中 128 是批量大小 4 是通道数最后 2 个维度是高度和宽度我有另一个张量叫做fake形状的 128 1 150 150 我想放弃最后一个list array从第 2 维
如何使用 pytorch 同时迭代两个数据加载器？

我正在尝试实现一个接收两张图像的暹罗网络我加载这些图像并创建两个单独的数据加载器在我的循环中我想同时遍历两个数据加载器以便我可以在两个图像上训练网络 for i data in enumerate zip dataloaders1
Pytorch 与 joblib 的 autograd 问题

将 pytorch 的 autograd 与 joblib 混合似乎存在问题我需要并行获取大量样本的梯度 Joblib 与 pytorch 的其他方面配合良好但是与 autograd 混合时会出现错误我做了一个非常小的例子显示串行
Pytorch TypeError：eq() 收到无效的参数组合

num samples 10 def predict x sampled models guide None None for in range num samples yhats model x data for model in sam
如何同时有效地运行多个 Pytorch 进程/模型？ Traceback：分页文件太小，无法完成此操作

背景我有一个非常小的网络我想用不同的随机种子进行测试该网络几乎只使用了我的 GPU 计算能力的 1 因此理论上我可以同时运行 50 个进程来同时尝试许多不同的种子 Problem 不幸的是我什至无法在多个进程中导入 pytorch 当
Huggingface 变形金刚模块未被 anaconda 识别

我正在使用 Anaconda python 3 7 Windows 10 我尝试通过安装变压器https huggingface co transformers https huggingface co transformers 在我的环境
如何解决错误：PyTorch 中预期输入批量大小与目标批量大小不匹配？

我尝试通过 PyTorch 在 CIFAR10 数据集上创建逻辑模型但是我收到错误 ValueError 预期输入batch size 900 与目标batch size 300 匹配我认为正在发生的事情是 3 100 是 300 所以
如何让火车装载机使用特定数量的图像？

假设我正在使用以下调用 trainset torchvision datasets ImageFolder root imgs transform transform trainloader torch utils data DataLoa
PyTorch 中的数据增强

我对 PyTorch 中执行的数据增强有点困惑现在据我所知当我们执行数据增强时我们保留原始数据集然后添加它的其他版本翻转裁剪等但 PyTorch 中似乎并没有发生这种情况据我从参考文献中了解到当我们使用data tra
带有填充掩码的 TransformerEncoder

我正在尝试使用 src key padding mask 不等于 none 来实现 torch nn TransformerEncoder 想象输入的形状src 20 95 二进制填充掩码的形状为src mask 20 95 填充标记的位置

随机推荐

koa2 post请求ctx.request.body空获取不到的解决办法

header请求头添加Content type application json
Java中的四种引用类型是哪些？

从一开始学习Java我们就知道Java的数据类型一般有两种一种是基本数据类型另一种是引用数据类型其中基本数据类型的值通常储存在栈内存中用于对该类型的对象进行存储而引用数据类型则在存储堆中对需要引用的对象进行引用引用是Java面
nps auth_key未授权访问漏洞

一漏洞简介 nps是一款轻量级高性能功能强大的内网穿透代理服务器目前支持tcp udp流量转发可支持任何tcp udp上层协议访问内网网站本地支付接口调试 ssh访问远程桌面内网dns解析等等此外还支持内网http代理
微信常见错误码及解决方案

40001 获取access token时AppSecret错误或者access token无效这个错误代码表示您的访问令牌 access token 已经过期或者无效需要重新获取 40003 openid错误 openid是微信公众
devServer-host解析

devServer的其他配置 host解析 host设置主机地址默认值是localhost 如果希望其他地方也可以访问可以设置为 0 0 0 0 localhost 和 0 0 0 0 的区别 localhost 本质上是一个域名通常
C语言实现队列

文章目录一什么是队列二队列的实现 2 1 队列的结构 2 2 队列的几个功能 2 2 1 初始化队列 2 2 2 队列判空 2 2 3 队尾入队列 2 2 4 队头出队列 2 2 5 获取队列头部元素 2 2 6 获取队列队尾元素
QCM2290平台XBL阶段I2C使能并点亮LED

描述 qcm2290平台上在低压充电阶段 XBL 需要驱动LED灯芯片提供接口供充电模块调用显示充电指示灯功能说明 LED控制芯片是I2C接口我只需要提供接口即可我这边实现了在开机时led灯闪烁在充电相关PmicLib目录下添
在webpack的less中使用绝对路径import

假设项目目录结构如下 webpack中 resolve modulesDirectories path join dirname node modules path join dirname src 在a less中写上 import st
干掉鲁大师监控,Windows免费监控软件

大家好今天我找到了一款在电脑上可以实时在任务栏显示实时网速的免费开源的小插件非常的好用而且呢它竟然还能实时的显示显卡和CPU的温度和占用一个百分比让你对你的电脑性能了如指掌一点也不逊色于收费的鲁大师桌面监控程序拿到我的电脑上面去
软件测试用例所有疑问，只需这篇就够了

1 测试用例是什么答测试用例的设计就是如何覆盖所有软件表现出来的状态即在满足输入输出的一组条件下软件运行是一系列有次序的受控制的状态变化过程 2 设计用例是否有必要答如果不记下来很可能到执行的时候测试点就遗漏了另外也不便
手撕源码之代码手写mvc

1 首先附上代码地址 https gitee com cqut lin hand tear source code 实现思路 Spring主要也是通过DispatcherServlet实现了Servlet这个接口又叫前端控制器来自前端的
51单片机的波特率

最近使用51单片机的时候设置串口的波特率需要多种固先记下来晶振更改的时候可以通过excel中的改动来调整 excel在126中email的网盘中 51单片机的波特率 et 下面列表是基于定时器2的方式2 自动重装的方式晶振 11
安卓Activity跳转的几种方式

本文转载于http blog sina com cn s blog 5140274d0100q4j7 html 本人仅作为学习交流之用请大家尊重原创第一种方式用action来跳转使用Action跳转如果有一个程序的 Android
Java从小白到大牛第1篇 Java基础-关东升-专题视频课程

Java从小白到大牛第1篇 Java基础 3042人已学习课程介绍本视频是智捷课堂推出的一套 Java语言学习立体教程的视频第一部分读者以及观看群是初级小白通过本视频的学习能够成为Java大牛本主要内容包括 Java语法基础 J
波特率_通信基本概念扫盲（波特率与带宽的关系）

在工作和学习中通常会遇到一些比较基础的技术性问题比如波特率为B的信号它的频谱宽度是多少说这个问题基础但答案并不简单今天分享的一些基本概念就是希望能解答上述的问题 1 信号的快慢表示信号快慢通常会用速率相关的参数比如码元速
计算机主机内部结构连接,电脑主机内部结构图详解

电脑主机内部结构分为多种硬件组合而成硬件可以理解为看得到摸得着的东西计算机硬件通常包括主板 CPU 内存硬盘光驱电源以及其他输入输出控制器和接口如 USB 控制器显卡网卡声卡等等位于主机箱内的通常称为内设而位于主机箱
android设备SD卡文件扫描与同步（暂备份）

package com owo contentresolvermedia import java io File import java util ArrayList import android app Activity import a
同一页面、不同页面监听localStorage变化

当同源页面的某个页面修改了localStorage 其余的同源页面只要注册了storage事件就会触发所以 localStorage 的例子运行需要如下条件同一浏览器打开了两个同源页面其中一个网页修改了 localStorage 另
简单易懂的隐马尔可夫模型（HMM）讲解

学习目标了解什么是马尔科夫链知道什么是HMM模型知道前向后向算法评估观察序列概率知道维特比算法解码隐藏状态序列了解鲍姆韦尔奇算法知道HMM模型API的使用一马尔科夫链在机器学习算法中马尔可夫链 Markov chain
Top-1错误率、Top-5错误率等常见的模型算法评估指标解析

Top 1 错误率指预测输出的概率最高的类别与人工标注的类别相符的准确率就是你预测的label取最后概率向量里面最大的那一个作为预测结果如过你的预测结果中概率最大的那个分类正确则预测正确否则预测错误比如预测100张图像的类别每

Top-1错误率、Top-5错误率等常见的模型算法评估指标解析

Top-1错误率、Top-5错误率等常见的模型算法评估指标解析 的相关文章

随机推荐

热门标签

Top-1错误率、Top-5错误率等常见的模型算法评估指标解析的相关文章