Paper and Codes Leaderboard

2023-11-10

介绍

此榜单用于评比网上开源的目标检测模型；

模型入选标准

以开源代码的精度为准；
【数据源一】Paper with Code – SOTA

1. 目标检测

COCO test-dev Benchmark (Object Detection) | Papers With Code

Paper and Codes for COCO (by 2023.3.31)

1. EVA, boxAP: 64.7 (test)
模型： EVA-CMaskRCNN
Note：EVA在进行检测任务时，是基于Cascade Mask R-CNN的。

1.1* Co-DETR, boxAP: 66.0 (test)
BoxAP-66.0对应的权重尚未公布，我们在其GitHub上咨询了开发者相关情况；

1.2* InternImage-H, boxAP: 65.5
Github-page: OpenGVLab/InternImage
Note：InternImage进行检测任务适配Mask
R-CNN；论文中没有提到“65.5”，而是用“65.4”作为主要贡献点，该结果基于用于DINO实现，不过目前训练配置未在GitHub上公开，（我们已经其repo上提出issue）

1.2* M3I Pre-training, boxAP: 65.4
根据 Papers with Code 的资料显示，这里的“65.4”就是使用了"M3I Pre-training"的“InternImage-H”。

1.3* Co-DETR, boxAP: 64.5
查看其Sense-X/Co-DETR，发现目前代码并未公布；

1.4* Group DETR v2 - pwc, boxAP: 64.5
Group DETR v2 的GitHub主页分数没有这么高，请参见 Group DETR v2 - github；
需要Object365预训练，暂时无法复现

2. FocalNet (DINO), boxAP: 63.5 (github, val)
FocalNet-L-DINO

3. Group DETR v2 - github, boxAP: 63.3 (val)
在其PaddleDetection主分支中，未发现相关代码；

PaddleDetection - 文玉老师：

在develop里了 https://github.com/PaddlePaddle/PaddleDetection/tree/develop/configs/group_detr

你clone代码之后checkout到develop就行，等到release分支里的话得下一次发版

需要等到下一次PaddleDetection发版才可以获得稳定版的代码；

4. Dual-Swin-B-CBNetv2, boxAP: 60.1
模型： HTC-DB-Swin-L (TTA)

4.1* Focal-L, boxAP: 58.9
Github-page: https://github.com/microsoft/Focal-Transformer
在其Github主页上未发现关于COCO数据集的精度数据，最高精度51.2；
（Focal-T-Cascade-Mask-R-CNN精度为51.5，不过会使用mask数据所以没有收录）；
4.2* DyHead: 58.7
Github-page: DynamicHead
在其Github主页上最高精度为49.8，暂时不予收录；
5. Swin-L: 58.0(val)
Github-page: Swin-L
在其Github主页上最高精度为58.0(val)；
6. YOLOR-D6*: 57.8
Github-page: YOLOR-D6*
7. SOLQ-{Swin-L & 1536}, boxAP: 56.5
模型：SOLQ-{Swin-L & 1536}
8. InternImage-XL, boxAP: 56.2
模型：InternImage-XL–Cascade
9. QueryInst , boxAP: 56.1
模型：QueryInst–Swin_L_300_queries–single_scale_testing
10. RT-DETR-R101, boxAP: 54.3
Note:

榜单上收录的模型分数一般是val集的分数，因为val集的结果我们是可以复现的；

COCO FPS Models (by 2023.02.18)

1. YOLOv7, boxAP: 56.8, FPS: 36
模型: YOLOv7-E6E
2. YOLOv5, boxAP: 55.0, FPS: 1e3/26.2=38.2
模型: YOLOv5x6
3. PP-YOLOE+, boxAP: 54.9, FPS: 45.0
模型: PP-YOLOE+_x
4. YOLOv8, boxAP: 53.9, FPS: 283.3
模型: YOLOv8x
4. RTMDet, boxAP: 52.6, FPS: 322.6
模型: RTMDet-x
5. YOLOv6, boxAP: 52.5, FPS: 98
模型: YOLOv6-L
6. PP-YOLOE, boxAP: 52.2, FPS: 95.2
模型: PP-YOLOE-x
7. PP-YOLOv2, boxAP: 50.3, FPS: 49.5
模型: PP-YOLOv2–ResNet101vd
PP-YOLOv2是由Paddle推出的目标检测模型；
8. FastViT-MA36-paper, boxAP: 45.1, FPS: 122.0 (8.2ms)
模型: FastViT-MA36-MaskRCNN
9. NanoDet-Plus-m-1.5x, boxAP: 34.1, FPS: 87.0 (11.50ms)
模型: NanoDet-Plus-m-1.5x
Note:

这里的“Real-Time”指的是FPS在30以上的模型；

Look at Batch Size

Model	mAP	FPS
YOLOv7	51.4	161
YOLOv7-X	53.1	114
YOLOv5n	28.0	Q
YOLOv5s	37.4	Q
YOLOv5m	45.4	Q
YOLOv5l	49.0	Q
YOLOv5x	50.7	Q
YOLOv5n6	36.0	Q
YOLOv5s6	44.8	Q
YOLOv5m6	51.3	Q
YOLOv5l6	53.7	Q
YOLOv5x6	55.0	Q
YOLOv5x6+TTA	55.8	Q
PP-YOLOE-s	43.1	Q
PP-YOLOE-m	48.9	Q
PP-YOLOE-l	51.4	Q
本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@) 《南溪的目标检测学习笔记》目标检测 FocalNet Paper and Codes Leaderboard 的相关文章基于深度学习的高精度人体摔倒行为检测识别系统（PyTorch+Pyside6+YOLOv5模型）摘要基于深度学习的高精度人体摔倒行为检测识别系统可用于日常生活中或野外来检测与定位人体摔倒行为目标利用深度学习算法可实现图片视频摄像头等方式的人体摔倒行为目标检测识别另外支持结果可视化与图片或视频检测结果的导出本系统采用YOLO 【CV】第 10 章：使用 R-CNN、SSD 和 R-FCN 进行目标检测大家好我是Sonhhxg 柒希望你看完之后能对你有所帮助不足请指正共同学习交流个人主页 Sonhhxg 柒的博客 CSDN博客欢迎各位点赞收藏留言系列专栏机器学习 ML 自然语言处理 NLP 深度学习 DL fore CVPR 2023｜UniDetector：7000类通用目标检测算法（港大&清华）作者 CV君编辑极市平台点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心目标检测技术交流群导读论文中仅用了500个类别参与训练就可以使UniDetector检测超过7k个类别向大目标检测从零开始的学习之路--原理篇安装相关 Anaconda官网下载安装下一步进行到底相关环境那儿记得打勾不然就自己添加下环境变量就好另一般进官网就找Download 再找相关想下载的版本适配系统之类的这里下载的是Python 3 7 version for W YOLOV2个人理解总结 YOLOv2框架图 YOLOv2改进之处 1 Batch Normalization BN Batch Normalization 层简单讲就是对网络的每一层的输入都做了归一化这样网络就不需要每层都去学数据的分布收敛会快点原来的YOL 使用labelme打标签，详细教程做图像语义分割打标签时需要用到labelme这个工具我总结了它的详细使用教程目录一安装labelme工具二文件位置关系三 labelme工具四 labelme工具的快捷键五代码将标签文件转为统一固定格式六总结一【目标检测】【语义分割】—Mask-R-CNN详解一 mask rcnn简介论文链接论文链接论文代码 Facebook代码链接 Tensorflow版本代码链接 Keras and TensorFlow版本代码链接 MxNet版本代码链接 mask rcnn是基于faster rcn 特定场景小众领域数据集之——焊缝质量检测数据集写这篇文章最大的初衷就是最近频繁的有很多人私信问我相关的数据集的问题基本上都是从我前面的目标检测专栏里面的这篇文章过来的感兴趣的话可以看下轻量级模型YOLOv5 Lite基于自己的数据集焊接质量检测从零构建模型超详细教程保姆级的目标检测之YOLOv1算法分析网络结构卷积层池化层全连接层输入 448 448 448 448 448 448大小的图片输出 7 7 【计算机视觉文章目录一检测相关 8篇 1 1 Impact of Image Context for Single Deep Learning Face Morphing Attack Detection 1 2 A Theoretical and IA-YOLO项目中DIP模块的初级解读 IA YOLO项目源自论文Image Adaptive YOLO for Object Detection in Adverse Weather Conditions 其提出端到端方式联合学习CNN PP和YOLOv3 这确保了CNN PP 快速椭圆检测代码调试记录代码环境 Windows11 vs2019 opencv3 3 1 Debugx64 一代码注释 1 realpath PATH MAX basename 这几句是为了在Ubuntu中运行时寻找路径用的 Ubuntu需要比较严格的路径从近两年的CVPR会议来看，目标检测的研究方向是怎么样的？ Old Xie CS2EE2CS Naiyan Wang 等 85 人赞同目前object detection的工作可以粗略的分为两类 1 使用region proposal的目前是主流比如RCNN SPP Net Fast RCNN 二进制.bin文件切分、bintopng、write import numpy as np import cv2 import os Your file path file dep open r E data 3DHuman Detection withoutlabel 20180715 50 目标检测之二（传统算法和深度学习的源码学习）目标检测之二传统算法和深度学习的源码学习本系列写一写关于目标检测的东西包括传统算法和深度学习的方法都会涉及到注重实验而不着重理论理论相关的看论文去哈主要依赖opencv 本文主要内容简单分析下yolo9000的原理然后使用o 基于ShuffleNetv2-YOLOv4模型的目标检测目录 1 引言摘要 1 1 说明 1 2替换完成的工程请参考gitee 2 网络结构基础 2 1YOLOv3 2 1 YOLOv4算法 2 3 ShuffleNetv2 2 4 替换后的网络结构 3 实验结果 3 1实验环境配置及数据集介 STM32f103增加ESP8266模块，通过Wifi用手机TCP服务端远程与STM32通信 STM32f103增加ESP8266模块通过Wifi用手机TCP服务端远程与STM32通信提示 esp8266开启透传模式连上路由器Wifi 电脑热点接入STM32串口引脚另外手机TCP服务端是手机IP地址串口号大于8000滴如何在linux系统下创建空白文本.txt文件如何在linux系统下创建空白文本 txt文件跳转到要新建文本的目录下打开终端输入命令最后跳转到要新建文本的目录下可利用cd命令在终端跳转或者直接到要新建文件的目录文件夹中打开终端输入命令 touch 文本名 txt 例如目标检测算法改进系列之添加SCConv空间和通道重构卷积 SCConv 空间和通道重构卷积 SCConv 空间和通道重构卷积的高效卷积模块以减少卷积神经网络 CNN 中的空间和通道冗余 SCConv旨在通过优化特征提取过程减少计算资源消耗并提高网络性能该模块包括两个单元 1 空间重构单元机器翻译：跨越语言边界的智能大使导言机器翻译作为人工智能领域的瑰宝正在以前所未有的速度和精度为全球沟通拓展新的可能性本文将深入研究机器翻译的技术原理应用场景以及对语言交流未来的影响 1 简介机器翻译是一项致力于通过计算机自动将一种语言的文本翻译成另一种语言的技随机推荐 2022 年企业 Java 面试前复习的正确姿势（已助力 512 人入职大厂）前言这份面试清单是今年 1 月份之后开始收集的一方面是给公司招聘用另一方面是想用它来挖掘在 Java 技术栈中还有一些知识点是我还在探索的我想找到这些技术盲点然后修复它以此来提高自己的技术水平说实话刚开始的时候整理这些面试题 Docker第二篇-Linux和Windows下安装Docker 文章目录 Docker版本说明 CentOS安装Docker 前提条件安装镜像加速删除Docker CE Windows安装Docker 前提条件安装镜像加速 Docker版本说明 Docker 分为 CE 和 EE 两大版本 C 树莓派烧录准备工作树莓派一张SD卡 SD尽可能的大不然安装完系统就没什么空间了建议64G 软件准备 1 洗卡软件 SDcard Formatter 2 烧录软件 win32diskimager 3 镜像文件可以从树莓派官网进行下载Rasp MySQL数据行溢出的深入理解一从常见的报错说起故事的开头我们先来看一个常见的sql报错信息相信对于这类报错大家一定遇到过很多次了特别对于OMG这种已内容生产为主要工作核心的BG 在内容线的存储中数据大一定是个绕不开的话题这里的数据大远不止存储空间占用多 jenkins搭建自动化部署(Windows) 官网 https jenkins io 选择相应版本下载安装后找到安装目录下jenkins war 可以放在tomcat下运行也可直接运行命令 java jar jenkins war 启动关闭命令 net start jenkins mysql 5.6压缩安装_mysql5.6zip格式安装过程第一步到官网下载mysql 5 6 44 winx64的压缩包文件格式第二步在我的电脑 gt 属性 gt 高级 gt 环境变量 path变量中添加mysql bin文件夹的路径第三步配置完环境变量之后先别忙着启动mysql 我们还 08-分布式 1 分布式中接口的幂等性的设计在高并发场景的架构里幂等性是必须得保证的比如说提交作业查询和删除不在幂等讨论范围 1 建唯一索引id 每次操作都根据操作和内容生成唯一的id 在执行之前先判断id是否存在如果不存在则执行后续 rem的使用方式 rem是什么 rem是指相对于根元素的字体大小的单位在日常开发过程中我们通常把根元素 html body 的字体设置为10px 方便于我们计算此时子元素的1rem就相当于10px rem与em的区别各自的优缺点 em子元素字体大小的e CVPR 2019 论文大盘点—人体姿态篇 CV君盘点了CVPR 2019 中有关人体姿态的论文其中研究 3D人体姿态估计的论文最多有 11 篇研究 2D 姿态估计的 7 篇姿态迁移 2 篇人体图像生成 1 篇人体捕捉 2 篇另外还有2篇创建了新的基准数据集姿态估计是 python云图安装相关插件 python3 m pip install jieba wordcloud matplotlib import matplotlib pyplot as plt import jieba from wordcloud impo 【Spring Boot】【前后端分离】后端接口返回结果统一封装文章目录创建 SpringBoot 项目封装返回结果实现返回对象的自动封装处理异常测试最近在尝试使用前后端分离的模式写一个简单的个人博客遇到接口数据返回结构的问题在网上查了一圈发现了一个很好用的方法在复现的过程中也遇到了算法设计与分析课后总结算法设计与分析课后总结算法设计与分析第1章算法设计基础课后习题第二章算法分析基础课后习题 1 考虑下面算法回答下列问题算法完成什么功能算法的基本语句时什么基本语句执行了多少次 2 分析以下程序段中基本语句的执行次数要求 100天精通Python（可视化篇）——第92天：Pyecharts绘制炫酷柱状图、条形图实战大全文章目录专栏导读 1 基础柱状图 2 旋转x轴标签 3 旋转坐标轴 4 添加坐标轴名称 5 添加标记点 6 添加标注线 7 添加数据 8 添加自定义背景图 9 堆叠柱状图 10 柱状图与折线图组合 11 三维柱状图 12 水平滑动鼠标滚包、模块、函数的关系结构三者关系 python中程序的结构是由包模块函数类大致构成其关系如下 package module function 模块定义与调用 1 python中一个 py文件都可以是一个module module可以有函数类代码组成如使用python解决中英混合参考文献中et al 和等的问题这个代码使用zipfile将docx进行解压然后操作document xml文件找到中文中的et al之后替换为等然后再压缩为docx import zipfile import re import os import shutil curl服务器文件,curl 向远程服务器传输file文件 public function upload 获取上传文件信息文件名称以自己实际上传文件名称为准 fileinfo FILE filename 请求参数依据商户自己的参数为准 requestParam version requestPa 声网(agora)音视频通话sdk—微信小程序demo 首先需要注册一个声网账号注册成功后创建项目 appid是指声网项目的appid 后续会在小程序的配置文件中用到微信小程序接入视频通话需要声网给开通小程序的权限给声网邮箱发送邮件注明开通微信小程序接入权限并给发送appid app Python代码扫描：企业级代码代码安全漏洞扫描Bandit 目录什么是Bandit 特点安装配置配置Bandit Pycharm配置外置工具使用实践命令行参数检查单个文件检查整个目录 PyCharm中对单个文件或者项目目录的扫描一个使用案例应用场景总结参考资料注意后续技术 js DOM DOM Document Object Model HTML 和 XML 文档的编程接口通过 DOM JavaScript 能够访问和改变 HTML 文档的所有元素 1 查找通过 id 查找 HTML 元素 div div 2 通过标签 Paper and Codes Leaderboard 目录介绍模型入选标准 1 目标检测 Paper and Codes for COCO by 2023 3 31 COCO FPS Models by 2023 02 18 Look at Batch Size 2 图像分类 ImageN 热门标签成长之旅 jekyll主题 Ai工具函数名类名学习前端知识实时汇率安卓逆向分析代理录制华为上机考试 ios跨线程通知项目视频资源品优购组件分享之后端 jdk1202 配置Java开发环境宝藏小工具 Powered by Hwhale

Paper and Codes Leaderboard

目录

介绍

模型入选标准

1. 目标检测

Paper and Codes for COCO (by 2023.3.31)

COCO FPS Models (by 2023.02.18)

Look at Batch Size

Paper and Codes Leaderboard 的相关文章

随机推荐

热门标签