【论文速递】CVPR2022 - 用于半监督物体检测的尺度等效蒸馏

2023-11-18

【论文速递】CVPR2022 - 用于半监督物体检测的尺度等效蒸馏

【论文原文】:Scale-Equivalent Distillation for Semi-Supervised Object Detection

获取地址:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9880000
CSDN下载:https://download.csdn.net/download/qq_50757624/87413811

博主关键词: 半监督,知识蒸馏,目标检测

推荐相关论文:

-无

摘要:

最近的半监督目标检测(SS-OD)方法主要基于自我训练,即通过教师模型在未标记的数据上生成硬伪标签作为监督信号。尽管他们取得了一定的成功,但半监督学习中有限的标记数据扩大了目标检测的挑战。我们通过实证实验结果分析了这些方法遇到的挑战。我们发现大量的假阴性样本和较差的定位精度缺乏考虑。此外,物体大小的巨大差异和类不平衡(即背景和物体之间的极端比例)阻碍了现有技术的性能。此外,我们通过引入一种新颖的方法,即尺度等效蒸馏(SED)来克服这些挑战,这是一种简单而有效的端到端知识蒸馏框架,可应对较大的对象大小差异和类不平衡。与之前的作品相比,SED有几个吸引人的好处。(1) SED 强加一致性正则化来处理大规模方差问题。(2)SED缓解了假阴性样本的噪声问题和较差的定位精度。(3)重新加权策略可以隐式筛选未标注数据的潜在前景区域,以减少类失衡的影响。广泛的实验表明,SED在不同数据集上的表现始终优于最近最先进的方法,并具有显着的利润。例如,当在MS-COCO上使用10%和5%的标记数据时,它比监督对应物高出10 mAP以上。

关键词 :半监督,知识蒸馏,目标检测,尺度等效。

简介:

深度神经网络在由大规模数据集驱动的监督学习框架下取得了强大的结果,例如 ImageNet [5](约 1 万张标记图像)。然而,与分类不同,目标检测还涉及使用边界框定位对象。因此,用于目标检测的注释要昂贵得多,导致标记数据与分类几乎没有关系。最近,用于分类的半监督学习(SSL)受到了很多关注[28],[2],[29],[33],其结果与ImageNet上的完全监督模型相当。然而,半监督目标检测(SS-OD)比ImageNet分类上的SSL更具挑战性。最近的SS-OD方法通过利用有限的标记数据和大量未标记的数据来提高性能,但它们存在目标大小的巨大差异,大量的假阴性实例和类不平衡问题,如图1所示。
在这里插入图片描述

Fig. 1. The overall framework of SED.

ImageNet 分类模型的物体尺度变化范围很小,而 MS-COCO 数据集 [18] 的尺度变化在检测器的对象实例中变化很大。如图 2a 所示,MS-COCO 中实例尺度的标准差为 188.4 像素,而 ImageNet 中的实例尺度标准差为 56.7 像素(面积的平方根)。检测器应该是与物体位置一致的比例,这意味着不同大小的图像的预测应该是等效的[27],[28]。然而,SS-OD中的现有技术[19]、[30]、[36]、[39]尚未考虑尺度一致性。 我们观察到客观性得分存在差异,如图 2b 所示。前景锚点与背景锚点的比率随着分数距离变大而增加,这意味着模型对对象实例的不透明,而对不同大小的实例视而不见。这种不一致通常可以通过多尺度推理融合来缓解,这增加了计算成本,并且需要复杂的操作来融合结果。

此外,最近的SS-OD方法[19],[29]在高数据场景中的性能适中,这是假阴性对象实例和较差的定位精度的结果。 如图 2c 所示,当 IoU 设置为 0.1 和 0.3 时,重新调用分别下降到 0.5 和 0.9,这表明大多数前台实例都是假阴性样本。精度在IoU=0.9小于 0.2,说明边界框的位置不够准确。低于硬阈值的“漏报”对象实例会导致识别不一致。

另一个障碍是前景和背景样本高度不平衡。RetinaNet的前景与背景样本的比例约为1:25,000[17]。由于类不平衡问题,平等对待所有区域[32]会导致背景样本对梯度有显著贡献,如图4所示。将前景区域与具有压倒性背景区域的未标记数据区区分开来具有挑战性。

为了克服上述挑战,我们提出了尺度等效蒸馏(SED),这是一种简单而有效的端到端半监督学习框架,用于目标检测。由于尺度是低维语义流形的基本因素,我们设计了一个跨不同水平预测的尺度一致性正则化,作为大目标大小方差的解。此外,针对硬伪标签噪声对识别一致性有不利影响的问题,该文提出一种自蒸馏方法在不增加可学习参数的情况下提高泛化性能。由于阶级失衡问题,压倒性的背景samples削弱了我们方法的效果。我们实施重新加权策略,重点关注不同级别输出之间的不一致以及教师和学生检测器之间的不一致。因此,我们的重新加权方法避免了从未标记的数据中明确选择潜在的前景区域。

为了评估 SED 的有效性,我们对目标检测基准 Pascal-VOC [7] 和 MS-COCO [18] 进行了扩展实验。当在MS-COCO上使用10%和5%的标记数据时,我们的方法比监督对应物高出10 mAP以上。此外,我们的方法还使用基于单特征图和特征金字塔的单级和两级检测器进行了测试。

我们的贡献如下:(1)SED强加了尺度一致性正则化,以克服大规模方差挑战。(2) SED 减轻了由假阴性样本和不协调的边界框回归引起的噪声概率。(3)重新加权策略可以隐式地从未标记的数据中筛选潜在的前景区域,以减少类不平衡的影响。
在这里插入图片描述
Fig. 2. (a) For the COCO dataset, all the images are resized such that the short edge has 800 pixels while the long edge has less than 1333 pixels. For the ImageNet dataset, all the images are resized to 224×224 to calculate the statistics. The scale of object is represented as the square root of the area. We discuss the typical training input size for ImageNet classification and COCO detection tasks. (b) All the scores are predicted on COCO minival dataset by the retinanet detector with FPN and ResNet 50 backbone, which is trained with 10% COCO data. The score distance is the absolute difference between the predictions of the image in different sizes. The y-axis is the average number of anchors per image. © We predict pseudo-label on the rest of COCO training data with a converged Faster-RCNN detector (with FPN and ResNet50 backbone), trained with 10% COCO data. The low average recall and precision show that hard pseudo-label incur more noise with false negative samples.

【论文速递 | 精选】

论坛地址:https://bbs.csdn.net/forums/paper
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【论文速递】CVPR2022 - 用于半监督物体检测的尺度等效蒸馏 的相关文章

  • 关于登录密码加密的三个方式

    登录密码对于用户来说是最重要的数据 所以在存储的时候需要进行加密 防止在一些外部攻击下用户重要数据被别人获取了 对于登录密码加密 本人整理了三种简单的方式 具体思路如下 一 数据库加密 1 在后端存入数据库时 通过sql语句进行对应数据库的
  • 安装Miniconda+python3.9开发环境

    因为如果你直接通过系统的Python环境开发项目的话 每一个项目下 都需要安装相应的模块环境 所以我这边推荐用Miniconda 通过这个可以大大减小磁盘的利用空间 毕竟开发时一个torch模块已经有一两个G了 多次下载浪费空间 一 下载并
  • oracle数据导入导出

    创建一个目录用来存导出的数据和log 数据所在的机器的目录 SQL gt create directory exp dir1 as home tyc 导出 oracle gzsw3 expdp sys 密码 tns配置中的实例名 schem
  • maven执行失败(mvn clean package)

    开发环境 sh all sh 诡异 build faild 在默认配置下 当Maven项目比较大 运行诸如 mvn clean package 的命令是需要很多的内存的并且会导致失败退出 在架构师哥的帮助下 通过设置maven的运行环境堆大
  • 对于前端开发在vs code中编写后出现的Cannot find module 'crypto-js/hmac-sha256.js'.报错

    移植了老师的代码 出现了该问题 应该是js加密的问题 而本机中并没有使用过js加密 所以并没有该包的原因 遵循没有就安装的方式进行解决 1 直接安装该包 网上大多数都是这个方法 命令行代码如下 npm install crypto js 跟

随机推荐

  • 老胡的周刊(第107期)

    老胡的信息周刊 1 记录这周我看到的有价值的信息 主要针对计算机领域 内容主题极大程度被我个人喜好主导 这个项目核心目的在于记录让自己有印象的信息做一个留存以及共享 项目 open interpreter 2 基于 LLM 为你提供一种新的
  • c99编译报错改用gnu99

    使用c99编译出警告信息 implicit declaration of function usleep 按常规来讲 出现 implicit declaration of function xxxx 是因为头文件未包含导致的 但是uslee
  • 在servlet中 PrintWriter out=response.getWriter()

    1 从HttpServletResponse中get一个PrintWriter 2 打个通俗的比方就是通过HttpServletResponse对象得到一支笔 然后就可以用out print 方法在网页上写任何你想显示的内容 out pri
  • extern “C“ __declspec(dllexport)是什么意思

    如果DLL是提供给VC 用户使用的 你只需要把编译DLL时产生的 lib提供给用户 它可以很轻松地调用你的DLL 但是如果你的DLL是供其他程序如VB delphi 以及 NET用户使用的 那么会产生一个小麻烦 因为VC 对于 declsp
  • Tensorflow初步之非线性回归

    神经网络 输入 1个神经元 中间层 10个神经元 输出 1个神经元 一 创造二次函数并加入噪声 import tensorflow as tf import matplotlib pyplot as plt import numpy as
  • 干货丨7款易上手C语言编程软件推荐

    C语言是一门历史很长的编程语言 其编译器和开发工具也多种多样 其开发工具包括编译器 现举几个开发工具供大家选择 当然也要根据自己的操作系统来选择适合自己的开发工具 好多刚开始接触c语言的朋友都想知道用上面软件开发c语言比较好 一般来说微软的
  • node版本升级:与node-sass、sass-loader版本不兼容问题

    npm WARN deprecated har validator 5 1 5 this library is no longer supported npm WARN deprecated uuid 3 4 0 Please upgrad
  • 浅谈人工智能:现状、任务、构架与统一

    浅谈人工智能 现状 任务 构架与统一 原创 2017 11 02 朱松纯 目录 引言 第一节 现状 正视现实 第二节 未来 一只乌鸦给我们的启示 第三节 历史 从 春秋五霸 到 战国六雄 第四节 统一 小数据 大任务 范式与认知构架 第五节
  • 《动手学深度学习 Pytorch版》 7.3 网络中的网络(NiN)

    LeNet AlexNet和VGG的设计模式都是先用卷积层与汇聚层提取特征 然后用全连接层对特征进行处理 AlexNet和VGG对LeNet的改进主要在于扩大和加深这两个模块 网络中的网络 NiN 则是在每个像素的通道上分别使用多层感知机
  • nginx 配置ssl后配置websockt

    1 前言 这里以Vue 和 nginx 1 22 0 为例 在nginx配置好ssl为前提下 2 代码 vue 连接路径 state ws new WebSocket wss ssl绑定域名 端口号 ws mediaToChatRoom 端
  • 一个参数一张Excel表,玩转Pandas的read_excel()表格读取

    作者 黄伟呢 来源 数据分析与统计学之美 我觉得很有必要讲述这个文章 进行数据处理的第一步就是Python数据读取 但是你可能没想到 在进行数据读取的同时 我们其实可以配合相关参数做很多事儿 这对于后续的数据处理都是极其有帮助 read e
  • 单元测试的策略

    1 逻辑覆盖 2 循环覆盖 3 同行评审 4 桌前检查 5 代码走查 6 代码评审 7 静态数据流分析 mock 对代码中某些不容易获取的对象创建虚拟对象来测试 stub 桩函数是代替某些被调用了但是没有编写代码 一般在增量迭代自低向上的过
  • Cloud Ace 进军南非——旨在将 Google Cloud 市场扩展到非洲最大的经济体

    本文由Cloud Ace整理发布 Cloud Ace是谷歌云全球战略合作伙伴 拥有 300 多名工程师 也是谷歌最高级别合作伙伴 多次获得 Google Cloud 合作伙伴奖 作为谷歌托管服务商 我们提供谷歌云 谷歌地图 谷歌办公套件 谷
  • [经验] 轻松解读PID控制算法的三种参数的自整定方法

    轻松解读PID控制算法的三种参数的自整定方法 机器人论坛 电子技术论坛 广受欢迎的专业电子论坛 elecfans com
  • MFC实用功能技术——窗口跳转

    MFC系列 0 MFC简易入门基础 1 MFC实用功能技术 窗口跳转 2 MFC实用功能技术 下拉列表添加值 实现的效果是从一个对话框 点击控件能跳转到另一个对话框 实现记录 看了很多别人的博客 要不是太简单自己不懂 要不是实现的有区别 所
  • 【经典】JAVA线程池

    JAVA多线程的五个状态 Running 运行态 该状态下线程池能够接受新的任务 Shutdown 该状态下不接受新的任务 但会继续处理已经添加的任务 Stop 该状态下不接受新的任务 并且会中断正在执行的任务 同时删除未处理的任务 Tid
  • 我国关税

    https zaq us tariff
  • bash: ifconfig: 未找到命令

    Linux CentOS 7 系统使用ifconfig命令不能使用 第一步 尝试安装插件 输入命令 yum install ifconfig 第二步 搜索可用插件 输入命令 yum search ifconfig 第三步 安装对应版本插件工
  • UNIAPP之IOS离线打包

    最新iOS平台SDK下载 https nativesupport dcloud net cn AppDocs download ios 下载SDK解压找到SDK点击打开此文件 HBuilder Hello xcodeproj 打开xcode
  • 【论文速递】CVPR2022 - 用于半监督物体检测的尺度等效蒸馏

    论文速递 CVPR2022 用于半监督物体检测的尺度等效蒸馏 论文原文 Scale Equivalent Distillation for Semi Supervised Object Detection 获取地址 https ieeexp