YOLOX的解耦头结构思考

2023-11-06

问题

YOLOX提出了一个Decoupled Head结构以代替YOLO Head，进而在YOLOv3 baseline的基础上提升了1.1个百分点的mAP，那为什么解耦头结构就能够提升检测效果呢？
在这里插入图片描述

调研

我主要在YOLOX原论文讲述Decoupled Head这一部分，找到了引用的两篇文献，并加以解读。
第一篇文献是Song等人在CVPR2020发表的“Revisiting the Sibling Head in Object Detector”。
文中提出了，在目标检测的定位和分类任务中，存在spatial misalignment的问题，我的理解是两个任务所聚焦和感兴趣的地方不同，分类更加关注所提取的特征与已有类别哪一类最为相近，而定位更加关注与GT Box的位置坐标从而进行边界框参数修正。因此如果采取用同一个特征图进行分类和定位，效果会不好，即所谓的misalignment的问题。
下图是原论文的一张图，旨在展示分类和定位所关注的内容是不一致的！
在这里插入图片描述
第二篇文献是Wu等人（也是旷视的团队）在CVPR2020发表的“Rethinking Classification and Localization for Object Detection”
文中重新对检测任务中的分类和定位两个子任务进行解读，结果发现：fc-head更适合分类任务，conv-head更适合定位任务，如下面图表结果所示。
第一行是对于分类任务而言，红色是fc-head，蓝色是conv-head，可以看到，在分类的分数上，fc-head显然更具优势，特别对于small objects；
第二行是对于定位任务而言，可以看到，在边界框回归IOU值上，conv-head更具优势。
在这里插入图片描述
基于上述的实验结果，该文章设计了一个Double-Head的结构（应该YOLOX的解耦头结构的灵感就是从这里来的），来提升检测的效果。

从实验结果中也可以看到，使用这种Double-Head的结构，可以将mAP提升2-3个百分点，效果还是很不错的！
在这里插入图片描述

总结

回到最初的问题：解耦头为何能够提升检测效果？
解耦头结构考虑到分类和定位所关注的内容的不同，比如上述Wu等人的论文所展示的。因此采用不同的分支来进行运算，有利于效果的提升！

我认为这就是一个探索的过程。这种共享的头结构最初在Fast RCNN论文中提出，一步到位，可大大提升检测速度，因此当时主要注重速度上的提升。
随着应用的逐渐广泛，包括单阶段、双阶段检测网络的发展，研究人员也逐渐在检测效果上寻找各种能提升的空间。那么对于这种耦头结构，通过实验现象和相关结果可以看到其局限性，因此研究人员提出了诸如Double-Head的结构来提升效果。
同时为了避免计算量的大量增加，比如YOLOX的Decoupled Head结构，会先进行1x1的降维操作，然后再接上分类和定位两个分支，做一个检测效果和速度的trade-off，这也是很常见的一个思路！

附：3篇论文的链接

YOLOX: Exceeding YOLO Series in 2021
Revisiting the Sibling Head in Object Detector
Rethinking Classification and Localization for Object Detection

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

YOLOX的解耦头结构思考的相关文章

为什么 RNN 需要两个偏置向量？

In Pytorch RNN 实现 http pytorch org docs master nn html highlight rnn torch nn RNN 有两个偏差 b ih and b hh 为什么是这样它与使用一种偏差有什么
使 CUDA 内存不足

我正在尝试训练网络但我明白了我将批量大小设置为 300 并收到此错误但即使我将其减少到 100 我仍然收到此错误更令人沮丧的是在 1200 个图像上运行 10 epoch 大约需要 40 分钟有什么建议吗错了我怎样才能加快这
pytorch 中的 autograd 可以处理同一模块中层的重复使用吗？

我有一层layer in an nn Module并在一次中使用两次或多次forward步这个的输出layer稍后输入到相同的layer pytorch可以吗autograd正确计算该层权重的梯度 def forward x x self
如何更新 PyTorch 中神经网络的参数？

假设我想将神经网络的所有参数相乘PyTorch 继承自的类的实例torch nn Module http pytorch org docs master nn html torch nn Module by 0 9 我该怎么做呢 Let n
如何计算 CNN 第一个线性层的维度

目前我正在使用 CNN 其中附加了一个完全连接的层并且我正在使用尺寸为 32x32 的 3 通道图像我想知道是否有一个一致的公式可以用来计算第一个线性层的输入尺寸和最后一个卷积最大池层的输入我希望能够计算第一个线性层的尺寸仅给出
Pytorch ValueError：优化器得到一个空参数列表

当尝试创建神经网络并使用 Pytorch 对其进行优化时我得到了 ValueError 优化器得到一个空参数列表这是代码 import torch nn as nn import torch nn functional as F fro
torch.stack() 和 torch.cat() 函数有什么区别？

OpenAI 的强化学习 REINFORCE 和 actor critic 示例具有以下代码加强 https github com pytorch examples blob master reinforcement learning r
如何使用Python计算多类分割任务的dice系数？

我想知道如何计算多类分割的骰子系数这是计算二元分割任务的骰子系数的脚本如何循环每个类并计算每个类的骰子先感谢您 import numpy def dice coeff im1 im2 empty score 1 0 im1 numpy
如何在 PyTorch 中对子集使用不同的数据增强

如何针对不同的情况使用不同的数据增强转换 Subset在 PyTorch 中吗例如 train test torch utils data random split dataset 80000 2000 train and test将具
在requirements.txt中包含.whl安装

如何将其包含在requirements txt 文件中对于Linux pip install http download pytorch org whl cu75 torch 0 1 12 post2 cp27 none linux x8
Pytorch .to('cuda') 或 .cuda() 不起作用并且卡住了

我正在尝试做 pytorch 教程当我尝试将他们的设备设置为 cuda 时它不起作用并且我的代码运行被卡住有关具体信息我正在使用 conda 环境蟒蛇3 7 3 火炬1 3 0 cuda 10 2 NVIDIA RTX2080TI
如何在不安装pytorch的情况下使用pytorch预训练模型？

我只想在 pytorch 中使用预先训练的模型而不安装整个包我可以从 pytorch 复制模型模块吗恐怕你不能这样做为了运行模型你不仅需要经过训练的权重 pth tar 文件还需要网络的结构即层它们如何相互连接等该网络结
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
无法在 Windows 10 上构建 Detectron2

尽管 Windows 上的 Detectron2 没有官方支持但有很多可用的说明我尝试按照这些说明进行操作但最终出现了相同的错误这是我的设置 OS Windows 10 专业版 19043 1466 微软视觉工作室 2019 CUD
当前向包含多个自动分级节点时，PyTorch 关于使用非完整后向挂钩的警告

最近升级后当运行 PyTorch 循环时我现在收到警告当前向包含多个自动分级节点时使用非完整后向钩子训练仍在运行并完成但我不确定应该将其放置在哪里register full backward hook功能我尝试将它添加到神经网络
没有名为“torch”或“torch.C”的模块

希望得到像我 5 这样的解释因为我已经检查了所有相关答案但没有一个有帮助我已经安装了Python 我已经安装了Pycharm 我已经安装了Anaconda 我已经安装了 Microsoft Visual Studio 我有not安装了
PyTorch 中的数据增强

我对 PyTorch 中执行的数据增强有点困惑现在据我所知当我们执行数据增强时我们保留原始数据集然后添加它的其他版本翻转裁剪等但 PyTorch 中似乎并没有发生这种情况据我从参考文献中了解到当我们使用data tra
无法在jupyter笔记本中导入torch

系统 macOS 10 13 6 蟒蛇 3 7 蟒蛇3 我遇到麻烦时import torch在 jupyter 笔记本中 ModuleNotFoundError No module named torch 这是我安装 pytorch 的方法
PyTorch 中的后向函数

我对 pytorch 的后向功能有一些疑问我认为我没有得到正确的输出 import numpy as np import torch from torch autograd import Variable a Variable torch
如何在 Google Colab 上安装 PyTorch v1.0.0+？

PyTorch v1 0 0 稳定版是发布于 2018 年 12 月 8 日 https github com pytorch pytorch releases tag v1 0 0成为之后7个月前宣布 https code fb com

随机推荐

laradock卡在raw.githubusercontent.com，怎么办

安装laradock的时候一直卡在 curl 35 OpenSSL SSL connect Connection reset by peer in connection to raw githubusercontent com 443 b
STCH8高级PWM定时器输入捕获功能脉宽测量

STC8H高级PWM定时器输入捕获功能脉宽测量相关篇 STC单片机利用PCA功能测量脉宽以及通用定时器外部中断测量脉宽此功能和stc8G系列和stc15系列的PCA功能类似带有此功能的有如下型号 STC8H 系列的单片机内部集成了8
面试-Redis篇-Redis有序集合实现多字段排序

排行榜需求根据分数进行排序分数相同时根据时间并列排序根据分数排序很容易实现正序 redis Yii app gt redis gt zrange key start end true 倒序 redis Yii app gt redi
基础算法题——错误票据（输入输出）

前言以前对getline并没有太深地理解甚至觉得cin就够用直至遇到了这道算法题错误票据题目问题描述某涉密单位下发了某种票据并要在年终全部收回每张票据有唯一的ID号全年所有票据的ID号是连续的但ID的开始数码是随机选定的
rockchip — display-timing dts配置

rockchip display timing dts配置如何确定lcd timing参数
JDBC、C3P0、DBUtils

一 JDBC的内容 JDBC API 定义了一系列的接口和类集成在java sql和javax sql DriverManager 管理各种不同的JDBC驱动 JDBC驱动负责连接不同类型的数据库二 JDBC访问数据库步骤 Drive
随机变量之常见分布

0 概述统计分析是可以帮助人们认清刻画不确定性的方法总体是某一特定事物可能发生结果的集合随机变量 Random Variable 则是一个不确定事件结果是数值函数 Function 也就是说把不确定事件的结果用数值来表述即得到随
开源盛会来袭，开发者们不容错过！

开源社 KAIYUANSHE 当今国内开源势头正劲想利用好开源软件在开源的大潮中乘风破浪成为佼佼者吗 2022 第七届中国开源年会 COSCon 22 将于 10 月 29 日 30 日在线上元宇宙传统线上直播渠道与线下 10
celery 启用worker ValueError: not enough values to unpack

2018 01 12 19 08 15 545 INFO MainProcess Received task tasks add 5d387722 5389 441b 9b01 a619b93b4702 2018 01 12 19 08 1
oracle数据泵导入导出6,Oracle使用数据泵导入/导出数据（expdp/impdp）

A电脑上的操作 expdp数据导出运行cmd 登录数据库输入命令 sqlplus 使用管理员角色登录需要在用户名后加 as sysdba 例如 sys as sysdba 创建目录路径输入命令 create directory dat
Docker基础与基于Docker的ROS系统使用说明

docker常用命令 docker load i xxx tar 将tar包导入为本地镜像 docker ps 列出所有正在运行的容器 docker image ls 列出所有的镜像 docker start
浅谈 IEEE 802.3af 标准 PSE电路

从第一篇文章我们已经大致了解整个POE的组成这篇文章我们主要学习 IEEE 802 3af 标准的受电端电路主要简化电路如下电路中省略了芯片等只为一个大概的电路图从电路可以看出主要分为三个部分具体过程如下在分级阶段 PSE
spring cloud 升级config-client及部署问题

接昨天升级微服务到config client又遇到一些问题花了大半天的时间其实不该花这么久的所以还是踩坑了直接说问题吧 rabbitmq连接报错主要有几个报错原因应该都是未连接上rabbitmq导致的 org springf
Ubuntu下QtOpenGL无法正常使用GLU库的解决方法

本文来自 http www linuxdiyf com linux 2873 html 一修改makefile文件某个库的接口不被识别的最可能的原因是没有包含该库的头文件可以尝试将 include
idea添加database插件_IDEA插件系列（6）：Database Navigator插件操作数据库

0 目录 1 插件介绍 2 安装方式 3 使用方法 1 插件介绍 Database Navigator插件该产品为IntelliJ IDEA开发环境和相关产品增加了广泛的数据库开发和维护功能它与合格且符合IDE要求的SQL和PL SQL
Web自动化测试12：Selenium窗口截图、验证码处理

更多功能测试以及全套学习路线图均在专栏戳进去领取 Web自动化测试01 认识web自动化在什么项目中适用 Web自动化测试02 Web自动化测试工具选择大全 Web自动化测试03 Selenium安装配置详细教程 Web自动化测试04
kubernetes Deployment 详解更新/回滚/缩放/暂停/恢复部署操作

涉及文档 Deployments 官方文档 Deployments 简介一个 Deployment 为 Pods 和 ReplicaSets 提供声明式的更新能力你负责描述 Deployment 中的目标状态而 Deployment
SpringToolSuite4中集成maven

目录一什么是Maven 二 Maven的使用一什么是Maven Maven是基于项目对象模型 POM project object model 可以通过一小段描述信息配置来管理项目的构建报告和文档的软件项目管理工具 Maven
ImportError lib64 libstdc++.so.6 version CXXABI 1.3.9 not found required by home anaconda

文章目录 1 现象 2 解决方案 3 参考 1 现象 ImportError lib64 libstdc so 6 version CXXABI 1 3 9 not found required by home qtxu anaconda3
YOLOX的解耦头结构思考

问题 YOLOX提出了一个Decoupled Head结构以代替YOLO Head 进而在YOLOv3 baseline的基础上提升了1 1个百分点的mAP 那为什么解耦头结构就能够提升检测效果呢调研我主要在YOLOX原论文讲述Deco

YOLOX的解耦头结构思考

问题

调研

总结

附：3篇论文的链接

YOLOX的解耦头结构思考 的相关文章

随机推荐

热门标签

YOLOX的解耦头结构思考的相关文章