【深度学习基础】损失函数

2023-11-08

深度学习基础:

  1. 性能评估指标
  2. 超参数介绍
  3. 损失函数

前言

本文主要总结一下常见目标检测的损失函数以及一些基础的函数,主要损失函数为mask-rcnn涉及到的损失函数包括:

  • MSE均方误差损失函数、
  • Cross Entropy交叉熵损失函数
  • 目标检测中常用的Smooth L1损失函数
  • focal loss,log loss
  • dice loss ,iou loss
    在这里插入图片描述

损失函数:

共分为两类,分类问题的损失,和回归问题的损失。
分类损失:

  • cross entropy loss
  • focal loss
  • log loss

回归损失:

  • L1 loss
  • L2 loss
  • smooth L1 loss

均方差损失函数(仅为比较经典)

均方差损失函数常用在最小二乘法中。它的思想是使得各个训练点到最优拟合线的距离最小(平方和最小)。均方差损失函数也是我们最常见的损失函数,定义如下:

在这里插入图片描述

其中, a=f(z)=f(w·x+b) :x是输入、w和b是网络的参数、 f(·) 是激活函数。

交叉熵损失函数(分类)

在这里插入图片描述

  • :是信息论中最基本、最核心的一个概念,它衡量了一个概率分布的随机程度,或者说包含的信息量的大小。
  • 交叉熵:的定义与熵类似,不同的是定义在两个概率分布而不是一个概率分布之上。对于离散型随机变量,交叉熵定义为
    在这里插入图片描述

交叉熵刻画的是两个概率分布之间的距离,或可以说它刻画的是通过概率分布q来表达概率分布p的困难程度,p代表正确答案,q代表的是预测值,交叉熵越小,两个概率的分布约接近。

  • softmax:(指在max的数据经常被取得,而小的数据也能被取得的softmax)计算公式:
    在这里插入图片描述
    softmax直白来说就是将原来输出是3,1,-3通过softmax函数一作用,就映射成为(0,1)的值,而这些值的累和为1(满足概率的性质),那么我们就可以将它理解成概率,在最后选取输出结点的时候,我们就可以选取概率最大(也就是值对应最大的)结点,作为我们的预测目标!

  • 交叉熵损失:计算神经网络gt分数和预测分数之间的差距,交叉熵损失函数公式为:

在这里插入图片描述
在这里插入图片描述

log loss(二分类)

在这里插入图片描述

focal loss(二分类)

focal loss为凯明大神的大作,主要用于解决多分类任务中样本不平衡的现象,可以获得比softmax_cross_entropy更好的分类效果。由log loss改进而来的,为了于log loss进行对比,公式如下:
在这里插入图片描述
在这里插入图片描述
比log loss多了一个
( 1 − p i ​ ) γ (1−p i ​ ) γ (1pi)γ
在这里插入图片描述

Smooth L1损失函数(回归)

Smooth L1损失函数是在Fast R-CNN中被提出,他的bound box的回归方式使用了该损失函数

对于目标检测中的回归问题,最初大多采用均方误差损失 ∣ ∣ y − f ( z ) ∣ ∣ 2 ||y-f(z)||^{2} yf(z)2 这样反向传播对w或者b求导时仍存在 y − f ( z ) y-f(z) yf(z) 那么当预测值和目标值相差很大时,就容易造成梯度爆炸。

所以我们将 ∣ ∣ y − f ( z ) ∣ ∣ 2 ||y-f(z)||^{2} yf(z)2 这种均方误差形式,转变成 S m o o t h L 1 ( y − f ( z ) ) Smooth_{L1}(y-f(z)) SmoothL1(yf(z))这种形式
smoothL1主要公式如下:
在这里插入图片描述

  • 当预测框与 ground truth 差别过大时,梯度值不至于过大;
  • 当预测框与 ground truth 差别很小时,梯度值足够小。
  • Smooth L1 Loss结合了L2 Loss收敛更快,且在0点有导数,便于收敛的好处。也在边界区域结合了L1 Loss的好处,让网络对异常值更加robust,能够在偏移值较大时还能拉回来
    在这里插入图片描述

dice loss

Dice 可以理解为是两个轮廓区域的相似程度,用A、B表示两个轮廓区域所包含的点集,定义为:
在这里插入图片描述
或者可表示为:
在这里插入图片描述

IOU loss

在这里插入图片描述

参考链接

【地址1】
【地址2】
【交叉熵参考】
【图像处理中的loss汇总】
【深度学习激活函数/损失函数总结】

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【深度学习基础】损失函数 的相关文章

  • 使用Python对Excel文件进行处理的小技巧

    Excel文件是一个常用的电子表格文件格式 它可以包含大量的数据和公式 Python有很多库可以用来处理Excel文件 下面介绍其中一些常用的库和技巧 目录 1 使用pandas库读取Excel文件 2 使用openpyxl库进行Excel
  • 内存管理分配,连续分配、分页存储、分段存储、段页式

    目录 1 连续分配管理 1 1 固定分区分配 1 2 动态分区分配 2 非连续分配方式 2 1 基本分页式内存分配管理 2 1 1 基本分页式内存思想与方法 2 1 2 进程逻辑地址与内存物理地址如何转换 2 1 3 页面在内存中的起始地址
  • typescript对与axios的封装

    import Modal message from antd import axios AxiosError AxiosRequestConfig AxiosResponse from axios import AdminConfig fr

随机推荐

  • 一篇搞懂java、javac版本不匹配发生的原因

    问题描述 当我们使用IDE或cmd进行java编译时 有时会发生这样的错误 Error A JNI error has occurred please check your installation and try again 异常部分描述
  • 前端面试的性能优化部分(6)每天10个小知识点

    目录 系列文章目录 前端面试的性能优化部分 1 每天10个小知识点 前端面试的性能优化部分 2 每天10个小知识点 前端面试的性能优化部分 3 每天10个小知识点 前端面试的性能优化部分 4 每天10个小知识点 前端面试的性能优化部分 5
  • sql-libs——less5(盲注)

    首先打开页面 输入 id 1 发现没有任何数据爆出这时把ID换成一个不存在数据 1试一下 发现连 you are in 都没有了 这就是典型的盲注 正确时显示you are in 不正确时什么也不显示 http 192 168 0 5 90
  • Wolfram Mathematica 动手实践

    特点 Mathematica 的介绍 目标是提供介绍 Mathematica 广度的实践经验 重点是易用性 内容 完整概述 基础知识 Mathematica 中的示例项目 输入和输出 文字处理和排版 幻灯片演示 Wolfram 语言基础 使
  • QT信号槽失效的原因

    转载自 https blog csdn net luolaihua2018 article details 110388411 信号槽失效的原因 用Qt进行信号与信号槽连接后 会出现信号槽不响应信号的情况 原因可能是以下的情况 1 类没有声
  • 【MATLAB第12期】基于LSTM长短期记忆网络的多输入多输出回归预测模型思路框架,含滑动窗口, 预测未来,单步预测与多步预测对比,多步预测步数对预测结果影响分析

    MATLAB第12期 基于LSTM RNN作为对比 长短期记忆网络的多输入多输出回归预测模型思路框架 含滑动窗口 预测未来 单步预测与多步预测对比 多步预测步数对预测结果影响分析 更新 2022 11 5更新RNN模型 预测结果附后 一 数
  • 初学(7)——Hadoop错误:can‘t create 事务 lock on /var/lib/rpm/.rpm.lock (权限不够)

    执行删除操作时出现错误 权限不够 1 使用sudo命令 2 如果出现上述情况 切换至root用户 将要执行该操作的用户添加到sudoers su vim etc sudoers xxx 要添加的用户 ALL ALL ALL 命令成功执行
  • Mac用iTerm2连接到Linux上,不能输入中文

    服务器是ubuntu 用Mac的iterm2 ssh连上去 终端显示中文乱码 也不能输入中文 然而本地终端可以显示和输入 解决方法 这种情况一般是终端和服务器的字符集不匹配 MacOSX下默认的是utf8字符集 输入locale可以查看字符
  • 步进电机实验

    通过 ULN2003 驱动模块控制 28BYJ48 步进电机运行方向和速度 按下 KEY1 键调节电机旋转方向 按下 KEY2 键 电机加速 当按下 KEY3 键 电机减速 实现对步进电机运动的简单控制 步进电机简介 步进电机是将电脉冲信号
  • java中io各种流的关闭顺序

    还是先看API void close Closes this stream and releases any system resources associated with it close void close throws IOExc
  • 【react从入门到精通】初识React

    文章目录 人工智能福利文章 前言 React技能树 什么是 React 安装和配置 React 创建 React 组件 渲染 React 组件 使用 JSX 传递属性 Props 处理组件状态 State 处理用户输入 事件处理 组合和嵌套
  • 生成扩散模型漫谈(一):DDPM = 拆楼 + 建楼

    说到生成模型 VAE GAN可谓是 如雷贯耳 本站也有过多次分享 此外 还有一些比较小众的选择 如flow模型 VQ VAE等 也颇有人气 尤其是VQ VAE及其变体VQ GAN 近期已经逐渐发展到 图像的Tokenizer 的地位 用来直
  • Mac环境下安装、配置cocos2d-x环境

    转自 https www jianshu com p 2649a88b7f4d Mac环境下安装 配置cocos2d x环境 玉米包谷关注 2017 09 23 11 16 07字数 207阅读 2 359 1 将cocos2d x下载到桌
  • 学习笔记:进程间通信

    进程间通信的方式 示例 管道的概念及使用 管道pipe详解点击此处 示例 注 写端fd 1 读端fd 0 创建共享内存 mmap函数 思考 总结 示例 mmap父子进程通信 匿名映射 示例 进程1 进程二 shmget函数和mmap的区别
  • 逆矩阵的概念与性质

    逆矩阵的概念与性质 定理1 若矩阵A是可逆的 则A的逆矩阵是唯一的 并记作A的逆矩阵为A 1 性质 定理3 设A为n阶矩阵 则下列各命题等价 1 A是可逆的 2 AX 0只有零解 3 A与I行等价 4 A可表为有限个初等矩阵的乘积 注意 初
  • Docker的概念(1)

    前置条件 需要掌握Linux及常用命令 目录 1 Docker是什么 2 Docker用途 3 Docker与虚拟化 4 Docker和一个正常的虚拟机有何区别 5 Docker虚拟化的好处 5 1 应用部署方便 5 2 服务器同等配置 性
  • NDK开发——FFmpeg实现视频转YUV、视频转RGB显示、音频转PCM、音频播放、音视频同步

    项目演示 前提准备 编译FFmpeg CMake并能运行 详细可见我博客 下载libyuv库并编译成libyuv so库 用于实现转换RGB格式功能 FFmpeg库简介 avcodec 编解码 包含 avformate 封装格式处理 avf
  • Linux makefile 教程 非常详细,且易懂

    最近在学习Linux下的C编程 买了一本叫 Linux环境下的C编程指南 读到makefile就越看越迷糊 可能是我的理解能不行 于是google到了以下这篇文章 通俗易懂 然后把它贴出来 方便学习 后记 看完发现这篇文章和 Linux环境
  • 烟雾调节器

    先看效果 烟雾调节展示 再看代码
  • 【深度学习基础】损失函数

    深度学习基础 性能评估指标 超参数介绍 损失函数 前言 本文主要总结一下常见目标检测的损失函数以及一些基础的函数 主要损失函数为mask rcnn涉及到的损失函数包括 MSE均方误差损失函数 Cross Entropy交叉熵损失函数 目标检