Paper and Codes Leaderboard

2023-11-10

介绍

此榜单用于评比网上开源的目标检测模型;

模型入选标准

  1. 以开源代码的精度为准;
  2. 【数据源一】Paper with Code – SOTA

1. 目标检测

COCO test-dev Benchmark (Object Detection) | Papers With Code

Paper and Codes for COCO (by 2023.3.31)

1. EVA, boxAP: 64.7 (test)
模型: EVA-CMaskRCNN
Note:EVA在进行检测任务时,是基于Cascade Mask R-CNN的。

1.1* Co-DETR, boxAP: 66.0 (test)
BoxAP-66.0对应的权重尚未公布,我们在其GitHub上咨询了开发者相关情况

1.2* InternImage-H, boxAP: 65.5
Github-page: OpenGVLab/InternImage
Note:InternImage进行检测任务适配Mask
R-CNN
;论文中没有提到“65.5”,而是用“65.4”作为主要贡献点,该结果基于用于DINO实现,不过目前训练配置未在GitHub上公开,(我们已经其repo上提出issue

1.2* M3I Pre-training, boxAP: 65.4
根据 Papers with Code 的资料显示,这里的“65.4”就是使用了"M3I Pre-training"的“InternImage-H”。

1.3* Co-DETR, boxAP: 64.5
查看其Sense-X/Co-DETR,发现目前代码并未公布;

1.4* Group DETR v2 - pwc, boxAP: 64.5
Group DETR v2 的GitHub主页分数没有这么高,请参见 Group DETR v2 - github
需要Object365预训练,暂时无法复现

2. FocalNet (DINO), boxAP: 63.5 (github, val)
FocalNet-L-DINO

3. Group DETR v2 - github, boxAP: 63.3 (val)
在其PaddleDetection主分支中,未发现相关代码;

PaddleDetection - 文玉老师:

  1. 在develop里了 https://github.com/PaddlePaddle/PaddleDetection/tree/develop/configs/group_detr
  2. 你clone代码之后checkout到develop就行, 等到release分支里的话得下一次发版

需要等到下一次PaddleDetection发版才可以获得稳定版的代码;

4. Dual-Swin-B-CBNetv2, boxAP: 60.1
模型: HTC-DB-Swin-L (TTA)

4.1* Focal-L, boxAP: 58.9
Github-page: https://github.com/microsoft/Focal-Transformer
在其Github主页上未发现关于COCO数据集的精度数据,最高精度51.2;
(Focal-T-Cascade-Mask-R-CNN精度为51.5,不过会使用mask数据所以没有收录);
4.2* DyHead: 58.7
Github-page: DynamicHead
在其Github主页上最高精度为49.8,暂时不予收录;
5. Swin-L: 58.0(val)
Github-page: Swin-L
在其Github主页上最高精度为58.0(val);
6. YOLOR-D6*: 57.8
Github-page: YOLOR-D6*
7. SOLQ-{Swin-L & 1536}, boxAP: 56.5
模型:SOLQ-{Swin-L & 1536}
8. InternImage-XL, boxAP: 56.2
模型:InternImage-XL–Cascade
9. QueryInst , boxAP: 56.1
模型:QueryInst–Swin_L_300_queries–single_scale_testing
10. RT-DETR-R101, boxAP: 54.3
Note:

  • 榜单上收录的模型分数一般是val集的分数,因为val集的结果我们是可以复现的;

COCO FPS Models (by 2023.02.18)

1. YOLOv7, boxAP: 56.8, FPS: 36
模型: YOLOv7-E6E
2. YOLOv5, boxAP: 55.0, FPS: 1e3/26.2=38.2
模型: YOLOv5x6
3. PP-YOLOE+, boxAP: 54.9, FPS: 45.0
模型: PP-YOLOE+_x
4. YOLOv8, boxAP: 53.9, FPS: 283.3
模型: YOLOv8x
4. RTMDet, boxAP: 52.6, FPS: 322.6
模型: RTMDet-x
5. YOLOv6, boxAP: 52.5, FPS: 98
模型: YOLOv6-L
6. PP-YOLOE, boxAP: 52.2, FPS: 95.2
模型: PP-YOLOE-x
7. PP-YOLOv2, boxAP: 50.3, FPS: 49.5
模型: PP-YOLOv2–ResNet101vd
PP-YOLOv2是由Paddle推出的目标检测模型;
8. FastViT-MA36-paper, boxAP: 45.1, FPS: 122.0 (8.2ms)
模型: FastViT-MA36-MaskRCNN
9. NanoDet-Plus-m-1.5x, boxAP: 34.1, FPS: 87.0 (11.50ms)
模型: NanoDet-Plus-m-1.5x
Note:

  • 这里的“Real-Time”指的是FPS在30以上的模型;

Look at Batch Size

Model mAP FPS
YOLOv7 51.4 161
YOLOv7-X 53.1 114
YOLOv5n 28.0 Q
YOLOv5s 37.4 Q
YOLOv5m 45.4 Q
YOLOv5l 49.0 Q
YOLOv5x 50.7 Q
YOLOv5n6 36.0 Q
YOLOv5s6 44.8 Q
YOLOv5m6 51.3 Q
YOLOv5l6 53.7 Q
YOLOv5x6 55.0 Q
YOLOv5x6+TTA 55.8 Q
PP-YOLOE-s 43.1 Q
PP-YOLOE-m 48.9 Q
PP-YOLOE-l 51.4 Q
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Paper and Codes Leaderboard 的相关文章

  • 基于深度学习的高精度人体摔倒行为检测识别系统(PyTorch+Pyside6+YOLOv5模型)

    摘要 基于深度学习的高精度人体摔倒行为检测识别系统可用于日常生活中或野外来检测与定位人体摔倒行为目标 利用深度学习算法可实现图片 视频 摄像头等方式的人体摔倒行为目标检测识别 另外支持结果可视化与图片或视频检测结果的导出 本系统采用YOLO
  • 【CV】第 10 章:使用 R-CNN、SSD 和 R-FCN 进行目标检测

    大家好 我是Sonhhxg 柒 希望你看完之后 能对你有所帮助 不足请指正 共同学习交流 个人主页 Sonhhxg 柒的博客 CSDN博客 欢迎各位 点赞 收藏 留言 系列专栏 机器学习 ML 自然语言处理 NLP 深度学习 DL fore
  • CVPR 2023|UniDetector:7000类通用目标检测算法(港大&清华)

    作者 CV君 编辑 极市平台 点击下方卡片 关注 自动驾驶之心 公众号 ADAS巨卷干货 即可获取 点击进入 自动驾驶之心 目标检测 技术交流群 导读 论文中仅用了500个类别参与训练 就可以使UniDetector检测超过7k个类别 向大
  • 目标检测从零开始的学习之路--原理篇

    安装相关 Anaconda官网下载安装下一步进行到底 相关环境那儿记得打勾 不然就自己添加下环境变量就好 另 一般进官网就找Download 再找相关想下载的版本 适配系统之类的 这里下载的是Python 3 7 version for W
  • YOLOV2个人理解总结

    YOLOv2框架图 YOLOv2改进之处 1 Batch Normalization BN Batch Normalization 层简单讲就是对网络的每一层的输入都做了归一化 这样网络就不需要每层都去学数据的分布 收敛会快点 原来的YOL
  • 使用labelme打标签,详细教程

    做图像语义分割 打标签时需要用到labelme这个工具 我总结了它的详细使用教程 目录 一 安装labelme工具 二 文件位置关系 三 labelme工具 四 labelme工具的快捷键 五 代码 将标签文件转为统一固定格式 六 总结 一
  • 【目标检测】【语义分割】—Mask-R-CNN详解

    一 mask rcnn简介 论文链接 论文链接 论文代码 Facebook代码链接 Tensorflow版本代码链接 Keras and TensorFlow版本代码链接 MxNet版本代码链接 mask rcnn是基于faster rcn
  • 特定场景小众领域数据集之——焊缝质量检测数据集

    写这篇文章最大的初衷就是最近频繁的有很多人私信问我相关的数据集的问题 基本上都是从我前面的目标检测专栏里面的这篇文章过来的 感兴趣的话可以看下 轻量级模型YOLOv5 Lite基于自己的数据集 焊接质量检测 从零构建模型超详细教程 保姆级的
  • 目标检测之YOLOv1算法分析

    网络结构 卷积层 池化层 全连接层 输入 448 448 448 448 448 448大小的图片 输出 7 7
  • 【计算机视觉

    文章目录 一 检测相关 8篇 1 1 Impact of Image Context for Single Deep Learning Face Morphing Attack Detection 1 2 A Theoretical and
  • IA-YOLO项目中DIP模块的初级解读

    IA YOLO项目源自论文Image Adaptive YOLO for Object Detection in Adverse Weather Conditions 其提出端到端方式联合学习CNN PP和YOLOv3 这确保了CNN PP
  • 快速椭圆检测代码调试记录

    代码环境 Windows11 vs2019 opencv3 3 1 Debugx64 一 代码注释 1 realpath PATH MAX basename 这几句是为了在Ubuntu中运行时 寻找路径用的 Ubuntu需要比较严格的路径
  • 从近两年的CVPR会议来看,目标检测的研究方向是怎么样的?

    Old Xie CS2EE2CS Naiyan Wang 等 85 人赞同 目前object detection的工作可以粗略的分为两类 1 使用region proposal的 目前是主流 比如RCNN SPP Net Fast RCNN
  • 二进制.bin文件切分、bintopng、write

    import numpy as np import cv2 import os Your file path file dep open r E data 3DHuman Detection withoutlabel 20180715 50
  • 目标检测之二(传统算法和深度学习的源码学习)

    目标检测之二 传统算法和深度学习的源码学习 本系列写一写关于目标检测的东西 包括传统算法和深度学习的方法都会涉及到 注重实验而不着重理论 理论相关的看论文去哈 主要依赖opencv 本文主要内容 简单分析下yolo9000的原理 然后使用o
  • 基于ShuffleNetv2-YOLOv4模型的目标检测

    目录 1 引言 摘要 1 1 说明 1 2替换完成的工程请参考gitee 2 网络结构基础 2 1YOLOv3 2 1 YOLOv4算法 2 3 ShuffleNetv2 2 4 替换后的网络结构 3 实验结果 3 1实验环境配置及数据集介
  • STM32f103增加ESP8266模块,通过Wifi用手机TCP服务端远程与STM32通信

    STM32f103增加ESP8266模块 通过Wifi用手机TCP服务端远程与STM32通信 提示 esp8266开启透传模式 连上路由器Wifi 电脑热点 接入STM32串口引脚 另外手机TCP服务端是手机IP地址 串口号 大于8000滴
  • 如何在linux系统下创建空白文本.txt文件

    如何在linux系统下创建空白文本 txt文件 跳转到要新建文本的目录下 打开终端 输入命令 最后 跳转到要新建文本的目录下 可利用cd命令在终端跳转 或者直接到要新建文件的目录文件夹中 打开终端 输入命令 touch 文本名 txt 例如
  • 目标检测算法改进系列之添加SCConv空间和通道重构卷积

    SCConv 空间和通道重构卷积 SCConv 空间和通道重构卷积 的高效卷积模块 以减少卷积神经网络 CNN 中的空间和通道冗余 SCConv旨在通过优化特征提取过程 减少计算资源消耗并提高网络性能 该模块包括两个单元 1 空间重构单元
  • 机器翻译:跨越语言边界的智能大使

    导言 机器翻译作为人工智能领域的瑰宝 正在以前所未有的速度和精度 为全球沟通拓展新的可能性 本文将深入研究机器翻译的技术原理 应用场景以及对语言交流未来的影响 1 简介 机器翻译是一项致力于通过计算机自动将一种语言的文本翻译成另一种语言的技

随机推荐

  • 2022 年企业 Java 面试前复习的正确姿势(已助力 512 人入职大厂)

    前言 这份面试清单是今年 1 月份之后开始收集的 一方面是给公司招聘用 另一方面是想用它来挖掘在 Java 技术栈中 还有一些知识点是我还在探索的 我想找到这些技术盲点 然后修复它 以此来提高自己的技术水平 说实话刚开始的时候整理这些面试题
  • Docker第二篇-Linux和Windows下安装Docker

    文章目录 Docker版本说明 CentOS安装Docker 前提条件 安装 镜像加速 删除Docker CE Windows安装Docker 前提条件 安装 镜像加速 Docker版本说明 Docker 分为 CE 和 EE 两大版本 C
  • 树莓派烧录

    准备工作 树莓派 一张SD卡 SD尽可能的大 不然安装完系统 就没什么空间了 建议64G 软件准备 1 洗卡软件 SDcard Formatter 2 烧录软件 win32diskimager 3 镜像文件 可以从树莓派官网进行下载Rasp
  • MySQL数据行溢出的深入理解

    一 从常见的报错说起 故事的开头我们先来看一个常见的sql报错信息 相信对于这类报错大家一定遇到过很多次了 特别对于OMG这种已内容生产为主要工作核心的BG 在内容线的存储中 数据大一定是个绕不开的话题 这里的数据 大 远不止存储空间占用多
  • jenkins搭建自动化部署(Windows)

    官网 https jenkins io 选择相应版本下载 安装后找到安装目录下jenkins war 可以放在tomcat下运行 也可直接运行命令 java jar jenkins war 启动 关闭命令 net start jenkins
  • mysql 5.6压缩安装_mysql5.6zip格式安装过程

    第一步 到官网下载mysql 5 6 44 winx64的压缩包文件格式 第二步 在我的电脑 gt 属性 gt 高级 gt 环境变量 path变量中添加mysql bin文件夹的路径 第三步 配置完环境变量之后先别忙着启动mysql 我们还
  • 08-分布式

    1 分布式中 接口的幂等性的设计 在高并发场景的架构里 幂等性是必须得保证的 比如说提交作业 查询和删除不在 幂等讨论范围 1 建唯一索引id 每次操作 都根据操作和内容生成唯一的id 在执行之前先判断id是否存在 如果不存在 则 执行后续
  • rem的使用方式

    rem是什么 rem是指相对于根元素的字体大小的单位 在日常开发过程中我们通常把根元素 html body 的字体设置为10px 方便于我们计算 此时子元素的1rem就相当于10px rem与em的区别 各自的优缺点 em子元素字体大小的e
  • CVPR 2019 论文大盘点—人体姿态篇

    CV君盘点了CVPR 2019 中有关人体姿态的论文 其中研究 3D人体姿态估计的论文最多 有 11 篇 研究 2D 姿态估计的 7 篇 姿态迁移 2 篇 人体图像生成 1 篇 人体捕捉 2 篇 另外还有2篇创建了新的基准数据集 姿态估计是
  • python云图

    安装相关插件 python3 m pip install jieba wordcloud matplotlib import matplotlib pyplot as plt import jieba from wordcloud impo
  • 【Spring Boot】【前后端分离】后端接口返回结果统一封装

    文章目录 创建 SpringBoot 项目 封装返回结果 实现返回对象的自动封装 处理异常 测试 最近在尝试使用前后端分离的模式写一个简单的个人博客 遇到接口数据返回结构的问题 在网上查了一圈 发现了一个很好用的方法 在复现的过程中也遇到了
  • 算法设计与分析课后总结

    算法设计与分析课后总结 算法设计与分析 第1章 算法设计基础 课后习题 第二章算法分析基础 课后习题 1 考虑下面算法 回答下列问题 算法完成什么功能 算法的基本语句时什么 基本语句执行了多少次 2 分析以下程序段中基本语句的执行次数 要求
  • 100天精通Python(可视化篇)——第92天:Pyecharts绘制炫酷柱状图、条形图实战大全

    文章目录 专栏导读 1 基础柱状图 2 旋转x轴标签 3 旋转坐标轴 4 添加坐标轴名称 5 添加标记点 6 添加标注线 7 添加数据 8 添加自定义背景图 9 堆叠柱状图 10 柱状图与折线图组合 11 三维柱状图 12 水平滑动 鼠标滚
  • 包、模块、函数的关系结构

    三者关系 python中程序的结构是由包 模块 函数 类大致构成 其关系如下 package module function 模块定义与调用 1 python中一个 py文件都可以是一个module module可以有函数 类 代码组成 如
  • 使用python解决中英混合参考文献中et al 和等的问题

    这个代码使用zipfile将docx进行解压 然后操作document xml文件 找到中文中的et al之后替换为 等 然后再压缩为docx import zipfile import re import os import shutil
  • curl服务器文件,curl 向远程服务器传输file文件

    public function upload 获取上传文件信息 文件名称以自己实际上传文件名称为准 fileinfo FILE filename 请求参数 依据商户自己的参数为准 requestParam version requestPa
  • 声网(agora)音视频通话sdk—微信小程序demo

    首先需要注册一个声网账号 注册成功后创建项目 appid是指声网项目的appid 后续会在小程序的配置文件中用到 微信小程序接入视频通话 需要声网给开通小程序的权限 给声网邮箱发送邮件 注明开通微信小程序接入权限 并给发送appid app
  • Python代码扫描:企业级代码代码安全漏洞扫描Bandit

    目录 什么是Bandit 特点 安装 配置 配置Bandit Pycharm配置外置工具 使用实践 命令行参数 检查单个文件 检查整个目录 PyCharm中对单个文件或者项目目录的扫描 一个使用案例 应用场景 总结 参考资料 注意 后续技术
  • js DOM

    DOM Document Object Model HTML 和 XML 文档的编程接口 通过 DOM JavaScript 能够访问和改变 HTML 文档的所有元素 1 查找 通过 id 查找 HTML 元素 div div 2 通过标签
  • Paper and Codes Leaderboard

    目录 介绍 模型入选标准 1 目标检测 Paper and Codes for COCO by 2023 3 31 COCO FPS Models by 2023 02 18 Look at Batch Size 2 图像分类 ImageN
Powered by Hwhale