目标检测2022最新进展

2023-10-31

前言

之前目标检测综述一文中详细介绍了目标检测相关的知识,本篇博客作为扩展补充,记录目前(2022)目标检测的最新进展,主要是在coco test-dev上霸榜且知名度较广的目标检测网络。具体详情可参考相关论文或者代码。

Swim Transformer V2

论文地址:Swin Transformer V2: Scaling Up Capacity and Resolution
代码地址:Swim Transformer V2 Code
该方法展示了将Swim Transformer扩展到30亿个参数并使其能够使用高达1536输入尺寸的图像进行训练的sota探讨。通过扩大网络容量和分辨率,Swim Transformer在四个具有代表性的视觉基准上创造了记录:ImageNet-V2 图像分类的 84.0% top-1 准确率,COCO 对象检测的 63.1/54.4 box/mask mAP,ADE20K 语义分割的 59.9 mIoU, Kinetics-400 视频动作分类的 top-1 准确率为 86.8%。Swin Transformer V2使用的技术通常为扩大视觉模型,但它没有像 NLP 语言模型那样被广泛探索,部分原因在于训练和应用方面,存在以下困难:1)视觉模型经常面临大规模不样本不均衡的问题;2)许多下游视觉任务需要高分辨率图像或滑动窗口,目前尚不清楚如何有效地将低分辨率预训练的模型转换为更高分辨率的模型;3)当图像分辨率很高时,GPU 内存消耗也是一个问题。为了解决这些问题,该研究团队提出了几种技术,并通过使用 Swin Transformer 作为案例研究来说明:1)后归一化技术和缩放余弦注意方法来提高大型视觉模型的稳定性;2) 一种对数间隔的连续位置偏差技术,可有效地将在低分辨率图像和窗口上预训练的模型转移到其更高分辨率的对应物上。此外,团队分享了关键实现细节,这些细节可以显著节省 GPU 内存消耗,从而使使用常规 GPU 训练大型视觉模型的方案变得可行。

在这里插入图片描述

Swin Transformer

论文:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
代码:Swin Transformer Code
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Dynamic Head

论文:Dynamic Head: Unifying Object Detection Heads with Attentions
代码:Dynamic Head Code

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

YOLOF

论文:You Only Look One-level Feature
代码:YOLOF Code
在这里插入图片描述

YOLOR

论文:You Only Learn One Representation: Unified Network for Multiple Tasks
代码:YOLOR Code

YOLOX

论文:YOLOX: Exceeding YOLO Series in 2021
代码:YOLOX Code

在这里插入图片描述

Scaled-YOLOv4

论文:Scaled-YOLOv4: Scaling Cross Stage Partial Network
代码:Scaled-YOLOv4 Code

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Scale-Aware Trident Networks

论文:Scale-Aware Trident Networks for Object Detection
代码:Scale-Aware Trident Networks Code

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

DETR

论文:End-to-End Object Detection with Transformers
代码:DETR Code

在这里插入图片描述
在这里插入图片描述

Dynamic R-CNN

论文:Dynamic R-CNN: Towards High Quality Object Detection via Dynamic Training
代码:Dynamic R-CNN Code

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

目标检测2022最新进展 的相关文章

随机推荐

  • 在idea中如何在控制台输出日志?——用log4j

    简单记录下idea中如何配置使得在控制台输出日志 首先做个对比 输出日志和不输出日志有什么区别 下面的例子是我在学习mybatis中查询数据库时返回的结果 不输出日志的结果显示如下 输出日志的结果显示如下 经过对比 是不是在输出结果的同时把
  • java 语言 if else语句的使用方法

    if else语句的结果如下 if 条件1 代码块1 else if 条件2 代码块2 else 代码块3 if else语句使用方法 如果条件1是true则执行 代码块1 如果条件2是true则执行代码块2 否则执行代码块3 下面是例子
  • XXX项目总结

    目录 1 SQLite 数据库 1 1 创建数据库连接 1 2 打开数据库连接 1 3 关闭数据库连接 1 4 查询数据库示例 结果为单条数据 1 5 查询数据库示例2 结果为多条数据 2 数据转换 2 1 QString 转 std st
  • 单循环链表实现(设立尾指针)(第二章 P35)

    设立尾指针的单循环链表 单链的循环链表结点的存储结构和单链表的存储结构一样 所不同的是 最后一个结点的 next 域指向头结点 而不是 空 这样 由表尾很容易找到表头 但若链表较长 则由表头找到表尾较费时 因而 单循环链表往往设立尾指针而不
  • Redis实战

    Redis是目前非常主流的KV数据库 它因高性能的读写能力而著称 其实还有另外一个优势 就是Redis提供了更加丰富的数据类型 这使得Redis有着更加广泛的使用场景 那Redis提供给用户的有哪些数据类型呢 主要有 string 字符串
  • 在HBuilder中怎么创建Vue项目

    软件信息 HBuilder X 3 1 18 目录 1 新建Element UI项目 2 更改App vue内容 3 在src中创建router文件夹并新建index js文件 4 在src中创建components文件夹存放组件 5 在s
  • django model字段

    1 AutoField 一个自动递增的整型字段 添加记录时它会自动增长 你通常不需要直接使用这个字段 如果你不指定主键的话 系统会自动添加一个主键字段到你的model 2 BooleanField 布尔字段 管理工具里会自动将其描述为che
  • Python与数据分析--Matplotlib-1

    目录 1 Matplotlib库函数导入 2 简单尝试绘图 3 绘制多条折线图 4 绘制多种颜色风格曲线 5 图片内容文本操作实例 6 图例设置实例 7 坐标轴设置实例 1 Matplotlib库函数导入 导入matplotlib库 imp
  • dplyr:一套数据处理语法

    可能更多的人知道Hadley大神是因为他那大名鼎鼎的ggplot2 但dplyr包也不遑多让 作为一套数据处理与清洗的语法 dplyr包都是你玩转数据的必备武器 R在基础配置中进行数据处理无疑也是okay的 但总有懒人会想到要偷更多懒 于是
  • Demo产品模块

  • 对称加密算法(DES、3DES、AES)

    文章目录 DES 3DES AES DES DES加密算法因现代的计算能力 已经被淘汰掉了 因为现在在24小时内就可以被破解 特点 分组加密算法 明文以64位分组 64位明文输入 64位密文输出 对称算法 加密和解密使用同一密钥 有效密钥长
  • servlet 3.0使用和原理

    目录 Servlet 3 0 起步 Servlet 3 0 异步 SPI原理分析 使用SPI手写Servlet 3 0 Servlet 3 0 起步 Servlet 3 0新增了若干注解 用于简化Servlet 过滤器和监听器的声明 使得w
  • LeetCode刷题之“最长公共前缀“的python解法之一

    最长公共前缀 编写一个函数来查找字符串数组中的最长公共前缀 如果不存在公共前缀 返回空字符串 示例 1 输入 flower flow flight 输出 fl 示例 2 输入 dog racecar car 输出 解释 输入不存在公共前缀
  • 图片路径转文件流

    export const imageToBase64 img gt Vue prototype imageToBase64 img gt 定义全局 var canvas document createElement canvas canva
  • 【DL】第 5 章:生成模型

    大家好 我是Sonhhxg 柒 希望你看完之后 能对你有所帮助 不足请指正 共同学习交流 个人主页 Sonhhxg 柒的博客 CSDN博客 欢迎各位 点赞 收藏 留言 系列专栏 机器学习 ML 自然语言处理 NLP 深度学习 DL fore
  • C++数据结构笔记(6)栈的链式存储结构

    对于栈的链式存储结构 实现原理本质上是受限的链表 此外与顺序存储不同的是 链式结构选用左边 头结点 作为栈的顶部 这样的好处是只要找到头结点即可实现插入元素等操作 LinkStack h头文件 ifndef LINKSTACK H defi
  • 好用的C库-cmockery单元测试

    cmockery简单使用 一 介绍 cmockery是用来给C语言函数做单元测试使用的 代码 我是很推崇面向API编程的 写功能的时候 尽可能先把问题拆分成几个接口 接口命名好之后 再实现 所以 我想弄个单元测试的库 督促自己面向API编程
  • 深度学习之LSTM时间序列预测

    LSTM long short term memory LSTM 长短时记忆网络 是循环神经网络 recurrent neural network RNN 的一个重要结构 循环神经的主要用途是处理和预测序列数据 全连接神经网络 感知机 BP
  • 高中计算机教案excel,[转载]高中信息技术教案(第三章Excel)

    课题 认识Excel 教学时间 授课班级 教学目标 了解Excel的启动 退出熟悉电子表格的功能 特点及应用 掌握Excel窗口各个组成部分 学会区分工作表和工作簿 了解工具菜单自定义与选项命令 教学重点 工作表和工作簿的关系 制定义Exc
  • 目标检测2022最新进展

    文章目录 前言 Swim Transformer V2 Swin Transformer Dynamic Head YOLOF YOLOR YOLOX Scaled YOLOv4 Scale Aware Trident Networks D