（五）比赛中的CV算法（下3）损失函数的设计

2023-05-16

——neozng1@hnu.edu.cn

这波是鸽了一个多月稳定回归了，本账号在升级后将作为HNU跃鹿战队的官方号进行运营。之后会继续保持1~2周一更的速度的。如果你觉得笔者写的还不错的话，请不要吝啬点赞噢。若想继续追更了解本系列的最新动态，来个关注吧！从2022年开始，将会有新的专栏开始更新！

同时，本系列的第六部分即算法的具体应用和部署从下次更新开始会和第五部分同步，因为两个章节的内容都实在有点多，而且光讲理论也确实挺没劲的，那么就来点能用的东西吧。

至此我们已经介绍了4个检测网络，分别是two-stage的代表R-CNN家族和one-stage的开创者yolo，现在可以先小小地来总结一下目标检测网络的设计思想和改进方向了。不过细心的你应该已经发现，我们没有介绍如何训练网络（即loss function的设计思想和具体实现，如何在训练过程中给网络的不同部分提供监督信息？），这其实也是很重要的一部分，我们将在总结完以后大致介绍一下loss funciton和网络pipeline的对应关系。

首先笔者想要再强调一下神经网络作为一个万能的函数拟合器的作用：只要合理的设计网络的任务和其损失函数并且提供对应的训练数据，它就能够完成你想做的事！从Faster-RCNN和YOLO的实现结构我们就可以看出，这些block难道有哪个是有实际物理意义的吗？显然没有，即使使用相同的架构，我也可以通过修改 loss functoin和任务需求来决定最后网络的输出是什么、具有什么意义。因此在设计网络的时候，最需要关注的问题是我们要如何把检测任务拆解成合适的几个子任务和模块、怎么样设计最有效的 loss、使用怎样的策略来减小搜索空间、如何去根据检测任务的特点来有针对性地给网络各个部分赋予实际意义。上面说的这些都是在给网络加入先验知识，告诉网络应该如何更好地去学习目标的特征、完成学习。

很多人说神经网络只不过是在搭积木、炼丹，此言差矣。诚然大部分时候我们需要花大功夫去调试去改参数，但是怎样设计一个网络还是有很大的学问的。现在也有很多科研人员、很多学者尝试让神经网络的设计更具有逻辑性，通过数学的语言更科学地去建模问题、用更成体系的理论去分析网络结构和模型，减少启发式的设计而更多地去基于模型来调参等等...... 和存在已久的传统医学现代医学之争一样，联结主义也一直为人们诟病缺少解释性，被符号主义和行为主义打压（虽然一直被打压但是神经网络还是以不可阻挡之势统治了当前AI的发展，唉呀妈呀真香～），笔者相信随着科研人员在可解释性这条道路越走越远（比如现在火热的可视化），神经网络最终会拥抱科学，完成华丽的蜕变（我们这些小noob就乖乖炼丹把evolution的事情都交给大佬们吧，不过也许你就是将来的大佬！）。

最后笔者想要再次强调强调强调：神经网络是一个万能的函数拟合器，拟合成什么样关键看你的设计！这里所说的设计也就是loss function的设计，LF能够用于衡量网络学习效果的好坏，又作为学习的优化目标，因此我们依据最小化LF的原则使用梯度下降+反向传播对网络的权重进行训练。

所以接下来让我们把网络需要实现的任务的设计思想具体化，看看其中最重要最关键的一环：loss function是如何设计的，并介绍一些对loss的优化方法。这里将会介绍MSE、交叉熵、FL、FCOS、IOU loss等经典方法。

MAE （mean average error）和RMSE（root mean square error）
- MAE即平均绝对值误差，计算得到的是各个样本输入得到的结果相对于对应的标签的差的绝对值，这也是计算误差最直观最简单的方法，输出结果和标签差了多少，我们就记多少误差。
  
  从数学计算角度看，MAE的结果就是残差的平均值。例如有3个西瓜样本的数据x1，x2，x3，每个样本都是一个5维的数据，即：[大小，花纹宽度，重量，颜色深度，拍击是否有回响] ，标签分别为30%，60%，90%将他们输入一个神经网络，希望该神经网络输出的信息为西瓜的甜度；那么，假设该网络对应三个输入的输出值分别为25%，55%，96%，计算其MAE就得到损失值为16/3=5.33。从损失函数这个取名我们也可以看出，其含义就是对于每一个和标签不同的输出，将会产生多少的误差（损失）。
  
  对于目标检测网络，我们要输出目标框的位置（x,y,w,h）和分类，因此标签也需要有对应的5个值。若采用MAE来计算损失函数，那么就是在一个batch结束后，分别统计每个待估值（需要得到的预测值）对于该batch各个样本的平均绝对误差，让损失函数对xi求偏导再将得到的结果作为反向传播的初始值，进行BP训练。分类只有是和不是，因此是一个二元的损失，但你仍然可以使用MAE作为分类损失函数，虽然它不是太好用。MAE还有一个缺点，就是在原点处不可导。
- RMSE和MAE的区别就在于，他会将误差求平方之后再求平均并在最后开方。
  
  我们之前已经提到过，设计不同的、有针对性的损失函数是神经网络改进的关键，那么RMAE相对MAE又有什么改进呢？可以看到，MAE对于不同的样本的损失采取的策略是“一视同仁”，即不论单个样本产生的损失值有多大，最后都是获得相同的权重。对于那些损失小的样本，我们会认为该样本网络已经学习得比较好，不需要在这些样本上花费过多的精力；而对于损失值较大的样本，更应该“照顾有加”。那么有没有什么办法实现这种操作？铺垫了这么多，RMAE肯定就是一种能实现该需求的损失函数。每个样本在最终损失中的贡献会随着该样本损失的增大而增大（取了平方，不再是线性关系，相当于y=x^2和y=x比较）。因此RMAE会对训练得不好得样本施以更大的惩罚。但是同样，对于离群值（在这里是特别大的异常值）将会有一个巨大的损失，这将会误导模型的训练，MAE就没有这个问题。
  
  此处特别注意，并不是 Loss越大，回传的梯度就越大，梯度只和 Loss function的导数（梯度）有关！网上有很多教程都出现了这个讹误，显然我们从梯度下降法的原理出发就会发现，我们把LF看作是权重ω和b的函数，分别对它们求偏导以得到当前的梯度值并根据往梯度方向更新权重，而LF在参数空间中某一点的大小和梯度是完全无关的！在下面介绍focal loss的时候我们还会再提到这一点。
  
  此处mark。
  
  不过不加开方也是可以的，这时候得到的值为MAE（mean square error），公式类似于我们常说的方差（不过方差计算时的yi是这组数据的平均值，MAE的意义显然不是数据的分散程度）。RMSE相对于MAE，由于在最后进行了开平方的操作，就不那么容易产生梯度爆炸的问题了。
  
  聪明的你应该想到，如果我想让大的更大小的更小，或者让大的不要那么大小的不要那么小，只需要改动误差上的次幂数就行：若选择损失的绝对值的三次方，那么误差大的样本的权重将进一步上升；而选择1.5次方，得到的结果将会比平方更缓和。（那么次幂小于1大于0又是什么情况？）
  
  此外，RMAE/MSE还有一个较大的缺点，在使用sigmoid作为激活函数配合使用时（即用于分类），收敛速度会非常慢。sigmoid激活函数在特别大或接近零时的导数几乎为零，这就导致当预测值落在这些区间时产生的误差非常小，而RMSE又刚好进一步减小了本就很小的梯度（列式计算一下L对xi的i偏导即可，如下图），因此在输出层，神经元的学习速度会非常缓慢。不过好在除了这种方法，还有一些更佳的分类损失函数设计策略（也就是下面要介绍的交叉熵，另外，ReLU系的激活函数几乎已经完全取代了sigmoid，这样在输入激活函数的值大于零的时候会有一个稳定的导数值，不过还是不推荐使用MSE作为分类损失函数）。
  
  使用MSE作为分类损失函数时求导得到的结果
  
  激活值为0/1或接近0/1时梯度会非常小
  
  sigmoid的导数
  
  从上面的分析中我们可以得出，这三者在目标检测中一般用于设计距离损失函数，用于计算预测得到的bbox和groundtruth的差别，也就是常说的回归问题。对于分类问题就要使用其他的损失函数了。
CE/BCE（cross entropy/ binary cross entropy）

既然已经有了距离损失函数，那我们就来看看交叉熵在分类应用的效果如何吧。这篇文章：损失函数：交叉熵详解从信息熵的前世今生介绍了交叉熵损失函数的由来，强烈推荐。BCE和CE的区别在于一个用于二分类，一个用于多分类，CE就是BCE的多分类推广形式。上面介绍MSE的时候已经提到，我们希望在样本预测值偏离标签大的时候拥有更大的损失值，而RMSE或MSE恰恰在分类任务上对于这点做的不好，因为分类只有错误和正确（0，1），这两者在这些区间的产生的损失值太小不利于网络的训练。

详细的推导的上方的教程里有，不在此赘述，直接看看BCE的形式：

此处时σ(xi)就是将网络最后一层的输出值送入sigmoid函数得到的（将输出归一化为概率，区间为[0,1] )。L由两项构成并且总有一项是零。

求L对xi的偏导，就能算出其结果恰正比于预测值和标签值GT的差。这样就解决了MSE存在的问题。不过前面提到，我们希望让误差大（分类分得不好）的样本拥有更大的权重，CE就无法做到这一点了，欲知如何解决请看Focal Loss。

多分类问题只需要对BCE进行简单的推广，在此直接给出其形式：

其中

即为softmax函数。

对比BCE的损失函数，细心的你会发现(1-yi)不见了，比如要分为 (apple,banana,pear) 这三个类，最后得到的向量为 [0.2 , 0.5 , 0.3] ，而标签为 [0，1，0] 即最后的分类为banana，apple和pear虽然分别有0.2和0.3的置信度但产生的误差即-0.2和-0.3却不会计入总损失！这样岂不是没办法改善假阳性的问题吗？别担心，我们使用的是softmax函数，由于归一化（除以各个分量的综合），它会让输出的向量各个分量的合即概率合为1，因此提升对yi=1的概率自然就会降低其他分类的预测概率了。

如果你觉得笔者写的还不错的话，请不要吝啬点赞噢。若想继续追更了解本系列的最新动态，来个关注吧！从2022年开始，将会有新的专栏开始更新！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

损失函数的设计

（五）比赛中的CV算法（下3）损失函数的设计的相关文章

vscode安装拓展插件失败要求手动安装，手动下载后导入安装仍然失败。（Error when installing ‘Python‘ extension. Please check the）

在vscode中点击对应插件的install按钮安装 xff0c 安装失败 xff0c 软件提示手动安装 manually install 英文报错为 xff08 39 Python 可为各种拓展插件 xff09 xff1a Error w
Hyper-V配置PCI设备直通（DDA）之GPU直通

记录性随笔 xff0c 较随意 xff0c 有相同需求和问题欢迎留言交流首先贴上所参考的大佬文章 xff1a https www licc tech article id 61 35 以下完全按照文章步骤进行 xff0c 并对遇到的问题提
java数据类型转换

一些初学JAVA的朋友可能会遇到JAVA的数据类型之间转换的苦恼 xff0c 例如 xff0c 整数和float double型之间的转换 xff0c 整数和String类型之间的转换 xff0c 以及处理显示时间方面的问题等下面笔者就
Ubuntu安装时卡在安装界面怎么办

当我们在虚拟机安装Ubuntu的时候 xff0c 可能很多的小伙伴会遇到界面卡住 xff0c 其实时那个界面显示太小了 xff0c 这时你应该关闭安装的界面 xff0c 你关闭之后会自动进入ubuntu的界面 xff0c 右击界面找到显示设
[编程题]带括号的四则运算

一问题描述输入字符串中的有效字符包括 0 9 43 xff0c 算术表达式的有效性由调用者保证输入描述 xff1a 输入一个算术表达式输出描述 xff1a 得到计算结果输入示例 xff1a 3 43 2 1 43 2 4 8 6
cJSON的简单应用（json对象、数组）

cJSON 结构 xff1a typedef struct cJSON structcJSON next prev next prevallow you to walk array object chains Alternatively u
关于阿里云上使用smtp的25号端口被禁用的问题

在使用python进行SMTP服务进行发送邮件的时候 xff0c 出现在发送的的过程中阻塞但是并不报错的现象 xff0c 经过调试后发现 xff0c 在连接SMTP服务器的时候发生阻塞这个原因的产生是因为阿里云服务器关闭了25号端口 xf
centos7中图数据库neo4j安装

neo4j是目前最流行的开源的图数据库之一 xff0c 喜欢研究新技术的朋友们可以尝试着搭建一下图数据库安装环境Centos7 xff08 阿里云vps xff09 版本 xff1a neo4j 社区版 1 首先安装jdk 2 安装neo
linux查看防火墙状态

一 iptables防火墙 1 基本操作查看防火墙状态 service iptables status 停止防火墙 service iptables stop 启动防火墙 service iptables start 重启防火墙 serv
centos7中mysql安装

环境 xff1a centos7 xff08 阿里云vps xff09 mysqld 5 7 27 先检查系统是否装有mysql xff0c 如果返回空值 xff0c 说明没有安装MySQL xff1b root 64 localhost
树莓派3B首次安装

下载系统 xff1a 树莓派官网https www raspberrypi org downloads raspbian 从该系统下载相关的镜像文件 xff0c 我这里用的是 2017 09 07 raspbian stretch lite
LightPC: Hardware and Software Co-Design for Energy-Efficient Full System Persistence(论文阅读翻译)

xff08 注 xff1a 课程作业要求 xff0c 机翻自己看的 xff09 Abstract 我们提出了LightPC xff0c 一种轻量级的持久性中心平台 xff0c 以使系统对电源故障具有鲁棒性 LightPC由硬件和软件子系统组
LINUX 常用命令

LINUX 常用命令 1 cd命令这是一个非常基本 xff0c 也是大家经常需要使用的命令 xff0c 它用于切换当前目录 xff0c 它的参数是要切换到的目录的路径 xff0c 可以是绝对路径 xff0c 也可以是相对路径如 xff1
Linux 下安装 WordPress

Linux 下安装 WordPress 1 下载 WordPress wget i https cn wordpress org wordpress 5 0 3 zh CN zip 2 解压 wordpress 5 0 3 zh CN zi
注册表操作，reg脚本简单编写

注册表操作 xff0c reg脚本简单编写添加项 Windows Registry Editor Version 5 00 HKEY CURRENT CONFIG System CurrentControlSet SERVICES TSD
EUI-64格式生成

EUI 64 IEEE EUI 64地址表示有一个用于网络接口寻址的新标准在IPV6中 xff0c 无状态自动配置机制使用EUI 64格式来自动配置IPV6地址无状态自动配置是指在网络中没有DHCP服务器的情况下 xff0c 允许节点自
Git使用

Git使用生成RSA密钥对 ssh keygen t rsa C email t 指定生成的加密方式 C 添加注释 xff0c 一般来说是邮箱注 xff1a 如果指定了文件名字为github rsa xff0c 需要配置config 内
maven 常用镜像仓库

maven 常用镜像仓库 lt mirror gt lt id gt alimaven lt id gt lt mirrorOf gt central lt mirrorOf gt lt name gt aliyun maven lt na
面向对象的语言主要有哪些

面向对象程序设计 Object Oriented Programming xff0c OOP 的实质是选用一种面向对象程序设计语言 OOPL xff0c 采用对象类及其相关概念所进行的程序设计主要有Smalltalk Eiffel C

随机推荐

Python如何自制包、如何安装自己的包并导入

首先科普一下包和模块的概念 xff1a 在Python中 xff0c 包是一个包含多个模块的目录 xff0c 而模块则是一个单独的文件一个包可以包含多个模块 xff0c 也可以包含其他的子包当一个目录下面有一个 init py文件时 x
使用OpenFeign代替RestTemplate来请求接口

在使用RestTemplate来调用接口服务的时候 xff0c 需要写一个调用地址的参数 xff0c 这样做不太好管理接口地址 xff0c OpenFeign就提供了一个比较好的管理方式 xff0c 类似于写一个Mapper的接口 xff0
手把手教你如何一键备份和恢复微信聊天记录

相信大家的聊天记录都非常重要 xff0c 怎么能说没就没 xff01 xff01 今天就分享一个备份聊天记录的方法备份聊天记录首先在电脑版微信上 xff0c 点击左下角三条横杠标志按钮 xff0c 选择备份与恢复在弹出的备份与
MonoSDF: Exploring Monocular Geometric Cues for Neural Implicit Surface Reconstruction论文翻译

机翻的这篇属实看不懂 Abstract 近年来 xff0c 神经隐式表面重建方法已成为多视图三维重建的流行方法与传统的多视图立体方法相比 xff0c 由于神经网络的归纳平滑偏差 xff0c 这些方法往往会产生更平滑和更完整的重建最先进
SPSS入门教程—相关性分析使用方法

IBM SPSS Statistics为用户提供了三种相关性分析的方法 xff0c 分别是双变量分析偏相关分析和距离分析 xff0c 三种相关分析方法各针对不同的数据情况 xff0c 接下来我们将为大家介绍如何使用SPSS相关性分析中的距
使用IBM SPSS Statistics的新手应该如何入门

一什么是IBM SPSS Statistics xff1f IBM SPSS Statistics 是一款强大的统计软件平台 xff0c 它所提供的数据分析功能 xff0c 可以帮助企业个人对各类数据进行切实可行的洞察分析 xff0c
linux 下清空回收站命令

linux 下清空回收站命令 sudo rm fr root Trash
了解CV和RoboMaster视觉组（目录和大纲）

NeoZng neozng1 64 hnu edu cn 全网最最最全的RoboMaster视觉组入门教程和概览来啦 xff01 0 Catalogue 摘要视觉组在不同兵种中的作用 2 1 装甲板识别 2 2 能量机关 2 3 哨兵 2
了解CV和RoboMaster视觉组（一）摘要

NeoZng neozng1 64 hnu edu cn 1 摘要在阅读本文之前 xff0c 你需要有计算机科学的基本知识并至少掌握一门编程语言 xff0c 同时对robomaster比赛规则和过程有大致的了解若只是希望知道视觉组的基本
了解CV和RoboMaster视觉组（二）视觉在各兵种中的作用

NeoZng neozng1 64 hnu edu cn 2 视觉在各兵种中的作用 2 1 装甲板识别 xff08 步兵英雄无人机 xff09 由于机器人上安装的图传模块到操作手看到的第一视角的延迟加上操作手反应速度的延迟 xff0c
了解CV和RoboMaster视觉组（三）视觉组使用的软件

NeoZng neozng1 64 hnu edu cn 3 视觉组接触的软件进行视觉开发会用到各种各样的软件开发环境辅助工具等 xff0c 所以很有必要了解一些相关的快捷键命令使用技巧选择一款适合自己的IDE能够提高开发效率
了解CV和RoboMaster视觉组（四）视觉组使用的硬件

NeoZng neozng1 64 hnu edu cn 4 视觉组接触的硬件虽然别人总觉得视觉组就是整天对着屏幕臭敲代码的程序员 xff0c 实际上我们也会接触很多的底层硬件与传感器 xff0c 在使用硬件的同时很可能还需要综合运用其他
（五）比赛中的CV算法（上）cv基础知识和opencv的api

5 比赛中的CV算法讲了这么多 xff0c 视觉组的重头戏算法终于来了在大部分时候我们都不需要设计底层的算法 xff0c 而是直接调用封装好的API xff0c 设计更具体的应用于特定问题的算法当然 xff0c 有必要了解一下造轮子
（五）比赛中的CV算法（上2）目标检测初步：神经网络及优化方法

NeoZng neozng1 64 hnu edu cn attention xff1a 5 2 5 3 5 4对于新人来说可能有一定难度若是新人或刚入门的 RMer xff0c 可以由此直接跳转道第六部分继续阅读 xff0c 第六部分看
[论文翻译] SalsaNet: Fast Road and Vehicle Segmentation in LiDAR Point Clouds for Autonomous Driving

Abstract 在本文中 xff0c 我们介绍了一种名为 SalsaNet 的深度编码器解码器网络 xff0c 用于 3D LiDAR 点云的高效语义分割 SalsaNet 通过使用点云的鸟瞰图 BEV 图像投影来分割场景中的道路可行
（五）比赛中的CV算法（上3）目标检测初步：CNN卷积神经网络

NeoZng neozng1 64 hnu edu cn 5 2 2 卷积神经网络在5 2 1中我们提到 xff0c 可以把图像resize成一个1xn的特征向量当作输入投入一个网络当中进行训练和预测 xff0c 但是这样做会出现很多的问
（五）比赛中的CV算法（中）目标检测的常见概念和术语

NeoZng neozng1 64 hnu edu cn 5 2 3 目标检测利用CNN我们已经可以完成对图像的识别和分类但是这样是远远不够的 xff0c 为了能准确定位图像中的物体 xff0c 我们需要对图像中所有目标进行定位 xff
（五）比赛中的CV算法（下1）目标检测算法：R-CNN家族

了解了基本概念开始上手目标检测吧在接下来这三个经典网络的介绍中 xff0c 我们尽量忽略细节上的推导如卷积的通道数和维度 xff0c 特征图的大小等 xff0c 而专注于介绍网络实现的思想和总体方法因此笔者默认你已经了解卷积神经网络的
（五）比赛中的CV算法（下2）YOLO算法和one-stage检测器

此时此刻恰如彼时彼刻 xff0c 一位大佬在阅读了Faster R CNN 中PRN设计的思想后直接拍桌怒起 xff1a 既然RPN能直接根据深度特征提取出可能存在物体的ROI xff0c 生成提议区域 xff0c 那我干脆就用网络直接回归
（五）比赛中的CV算法（下3）损失函数的设计

neozng1 64 hnu edu cn 这波是鸽了一个多月稳定回归了 xff0c 本账号在升级后将作为HNU跃鹿战队的官方号进行运营之后会继续保持1 2周一更的速度的如果你觉得笔者写的还不错的话 xff0c 请不要吝啬点赞噢若想继

（五）比赛中的CV算法（下3）损失函数的设计

如果你觉得笔者写的还不错的话，请不要吝啬点赞噢。若想继续追更了解本系列的最新动态，来个关注吧！从2022年开始，将会有新的专栏开始更新！

（五）比赛中的CV算法（下3）损失函数的设计 的相关文章

随机推荐

热门标签

（五）比赛中的CV算法（下3）损失函数的设计的相关文章