DINO-DETR在COCO缩减数据集上实验结果分析

2023-11-01

问题篇

博主在进行DINO-DETR模型实验时，使用缩减后的COCO数据集进行训练，发现其mAP值只能达到0.27作用，故而修改了下pycocotool的代码，令其输出每个类别的AP值，来看看是由于什么原因导致这个问题。
之所以这样是因为博主认为各类别的AP值是不均匀的，必定由学得好的与学得不好的。
参数设置：batch-size=1,lr=0.00005
使用22个epoch中训练结果最好的那个进行验证，结果如下：

【truck，car，bus】

分别为0.02，0.11，0.70，map为0.28
在这里插入图片描述

batch-size=2,lr=0.0001,epoch=24。结果如下：

在这里插入图片描述

随后使用官方给定的训练后的模型进行测试：

【'person', 'bicycle', 'car', 'motorcycle', 'airplane', 'bus', 'train', 'truck'】

对应car，bus，truck为：0.49，0.72，0.42，map值为0.54
在这里插入图片描述

上述实验结果首先证明了博主的猜想，即各个类别的AP值是不同的，也就说明其并非是对所有类别信息都有一个较好的结果。
其次尝试分析一下造成这个问题的原因。

首先在我们缩小的COCO数据集上，尽管car的标注较多，但目标都较小，而且存在很大程度的遮挡。且car在出现时背景复杂多变（有时是通过窗户看到，有时出现在马路上，有时旁边出现其他的物体），周边出现多种信息。
而bus尽管数量上并不占优，但其在出现时特征较为明显，显示较为完整，且出现时背景较为固定。（多为公路上出现）故而其学习效果较好。

博主选择了几个具有代表性的图像进行展示，用以证实博主上面的猜想。

在这里插入图片描述

输出训练过程中loss值变化情况：

在这里插入图片描述

使用DINO-DETR官方给定的权重模型来验证完整COCO数据集，完整结果如下：

IoU metric: bbox
 Average Precision  (AP) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.491, per category = [ 0.607  0.368  0.493  0.505  0.750  0.727  0.723  0.428  0.321  0.313
  0.709  0.690  0.530  0.293  0.434  0.793  0.721  0.654  0.603  0.638
  0.717  0.781  0.752  0.730  0.192  0.468  0.216  0.421  0.528  0.729
  0.301  0.457  0.518  0.509  0.388  0.423  0.576  0.461  0.568  0.434
  0.442  0.495  0.464  0.280  0.264  0.471  0.310  0.270  0.431  0.392
  0.262  0.277  0.481  0.610  0.560  0.447  0.345  0.499  0.306  0.519
  0.336  0.664  0.637  0.676  0.651  0.401  0.579  0.416  0.638  0.398
  0.566  0.424  0.671  0.200  0.568  0.418  0.356  0.540  0.169  0.349]
 Average Precision  (AP) @[ IoU=0.50      | area=   all | maxDets=100 ] = 0.667, per category = [ 0.854  0.625  0.734  0.775  0.898  0.854  0.879  0.590  0.578  0.579
  0.869  0.777  0.706  0.406  0.639  0.921  0.852  0.856  0.832  0.848
  0.898  0.910  0.925  0.899  0.339  0.683  0.363  0.644  0.740  0.909
  0.574  0.618  0.746  0.735  0.630  0.707  0.791  0.698  0.822  0.623
  0.654  0.657  0.637  0.442  0.377  0.609  0.466  0.378  0.566  0.512
  0.446  0.417  0.639  0.797  0.714  0.650  0.529  0.634  0.498  0.658
  0.469  0.794  0.813  0.806  0.831  0.597  0.737  0.622  0.767  0.552
  0.713  0.644  0.780  0.380  0.781  0.591  0.479  0.698  0.216  0.496]
 Average Precision  (AP) @[ IoU=0.75      | area=   all | maxDets=100 ] = 0.536, per category = [ 0.660  0.353  0.531  0.537  0.822  0.799  0.812  0.481  0.303  0.312
  0.802  0.742  0.564  0.315  0.447  0.836  0.778  0.730  0.664  0.706
  0.790  0.833  0.841  0.791  0.199  0.510  0.219  0.462  0.585  0.860
  0.268  0.515  0.592  0.572  0.416  0.461  0.621  0.500  0.626  0.488
  0.465  0.547  0.500  0.291  0.291  0.525  0.333  0.298  0.476  0.426
  0.268  0.302  0.501  0.680  0.615  0.497  0.365  0.536  0.341  0.527
  0.351  0.729  0.715  0.741  0.775  0.480  0.635  0.446  0.738  0.412
  0.713  0.417  0.746  0.187  0.634  0.437  0.363  0.579  0.200  0.428]
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.327, per category = [ 0.409  0.223  0.388  0.338  0.704  0.394  0.449  0.238  0.246  0.267
  0.448  0.346  0.263  0.184  0.315  0.396  0.494  0.351  0.438  0.531
  0.516  0.681  0.612  0.457  0.206  0.302  0.185  0.324  0.383  0.666
  0.292  0.332  0.482  0.519  0.410  0.382  0.461  0.315  0.478  0.326
  0.279  0.333  0.301  0.204  0.244  0.263  0.159  0.095  0.121  0.227
  0.154  0.204  0.314  0.385  0.423  0.324  0.255  0.131  0.195  0.029
  0.055  0.069  0.332  0.194  0.546  0.349  0.284  0.288  0.250  0.113
  0.532  0.296  0.800  0.164  0.459  0.275  0.115  0.176  0.131  0.309]
 Average Precision  (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.524, per category = [ 0.675  0.427  0.637  0.456  0.735  0.578  0.348  0.455  0.370  0.512
  0.722  0.729  0.459  0.263  0.619  0.763  0.726  0.645  0.647  0.675
  0.661  0.781  0.722  0.770  0.189  0.514  0.288  0.554  0.510  0.817
  0.416  0.688  0.806  0.556  0.465  0.503  0.693  0.537  0.638  0.588
  0.589  0.620  0.629  0.456  0.354  0.517  0.333  0.441  0.276  0.433
  0.303  0.359  0.599  0.511  0.614  0.505  0.387  0.382  0.372  0.197
  0.199  0.573  0.608  0.573  0.752  0.561  0.583  0.545  0.614  0.325
  0.538  0.484  0.415  0.292  0.678  0.490  0.465  0.496  0.279  0.403]
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.630, per category = [ 0.796  0.650  0.734  0.659  0.784  0.864  0.767  0.572  0.507  0.613
  0.856  0.961  0.780  0.492  0.817  0.813  0.760  0.809  0.720  0.779
  0.789  0.810  0.849  0.778  0.274  0.621  0.155  0.701  0.742  0.894
  0.221  0.541  0.686  0.421  0.027  0.583  0.548  0.664  0.575  0.697
  0.789  0.729  0.594  0.423  0.440  0.639  0.543  0.438  0.576  0.601
  0.285  0.342  0.603  0.732  0.817  0.539  0.484  0.563  0.324  0.554
  0.470  0.734  0.748  0.807  0.802  0.634  0.684  0.692  0.783  0.490
  0.824  0.485  0.740  0.401  0.619  0.650  0.535  0.704  0.482  0.830]
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=  1 ] = 0.379, per category = [ 0.205  0.289  0.192  0.299  0.583  0.562  0.668  0.396  0.158  0.146
  0.680  0.719  0.427  0.290  0.215  0.769  0.664  0.400  0.141  0.192
  0.294  0.589  0.279  0.386  0.253  0.283  0.252  0.348  0.231  0.615
  0.243  0.446  0.450  0.196  0.387  0.388  0.527  0.360  0.502  0.254
  0.208  0.314  0.441  0.276  0.292  0.352  0.148  0.159  0.382  0.174
  0.110  0.111  0.262  0.429  0.149  0.273  0.188  0.522  0.271  0.596
  0.425  0.604  0.555  0.614  0.609  0.310  0.515  0.443  0.704  0.444
  0.722  0.440  0.606  0.090  0.483  0.310  0.450  0.382  0.409  0.304]
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets= 10 ] = 0.651, per category = [ 0.613  0.509  0.588  0.606  0.830  0.811  0.832  0.705  0.454  0.459
  0.819  0.816  0.725  0.508  0.445  0.902  0.861  0.738  0.608  0.642
  0.765  0.894  0.784  0.800  0.506  0.602  0.503  0.540  0.597  0.813
  0.481  0.633  0.605  0.557  0.608  0.564  0.699  0.599  0.729  0.574
  0.568  0.649  0.680  0.522  0.561  0.701  0.434  0.493  0.751  0.531
  0.417  0.435  0.634  0.725  0.577  0.577  0.512  0.789  0.577  0.793
  0.652  0.813  0.790  0.800  0.756  0.619  0.779  0.650  0.827  0.665
  0.822  0.666  0.814  0.299  0.743  0.628  0.639  0.704  0.600  0.570]
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.727, per category = [ 0.735  0.599  0.682  0.704  0.877  0.837  0.865  0.791  0.604  0.537
  0.824  0.820  0.792  0.612  0.599  0.909  0.869  0.809  0.766  0.792
  0.871  0.904  0.865  0.857  0.590  0.718  0.587  0.597  0.721  0.823
  0.590  0.686  0.650  0.700  0.695  0.596  0.739  0.666  0.759  0.682
  0.643  0.734  0.718  0.592  0.624  0.767  0.659  0.640  0.792  0.694
  0.626  0.609  0.742  0.792  0.748  0.733  0.658  0.848  0.651  0.845
  0.718  0.857  0.803  0.832  0.759  0.682  0.783  0.672  0.827  0.706
  0.822  0.707  0.850  0.526  0.764  0.709  0.650  0.769  0.709  0.607]
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.563, per category = [ 0.575  0.433  0.587  0.553  0.777  0.550  0.675  0.662  0.490  0.491
  0.648  0.644  0.619  0.435  0.486  0.625  0.616  0.627  0.630  0.678
  0.753  0.840  0.717  0.677  0.522  0.532  0.483  0.475  0.561  0.752
  0.510  0.542  0.612  0.648  0.609  0.531  0.597  0.524  0.644  0.594
  0.516  0.611  0.574  0.502  0.517  0.592  0.490  0.460  0.372  0.520
  0.431  0.492  0.536  0.581  0.631  0.544  0.518  0.344  0.491  0.700
  0.305  0.386  0.533  0.565  0.660  0.619  0.394  0.534  0.525  0.340
  0.900  0.502  0.800  0.449  0.666  0.565  0.362  0.428  0.600  0.556]
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.767, per category = [ 0.800  0.687  0.812  0.684  0.879  0.768  0.656  0.795  0.663  0.710
  0.823  0.833  0.762  0.650  0.799  0.832  0.868  0.793  0.791  0.830
  0.821  0.846  0.838  0.831  0.686  0.750  0.728  0.757  0.747  0.920
  0.805  0.904  0.933  0.815  0.808  0.710  0.838  0.727  0.802  0.805
  0.764  0.836  0.829  0.761  0.834  0.790  0.682  0.744  0.754  0.737
  0.632  0.705  0.800  0.759  0.801  0.756  0.708  0.759  0.688  0.464
  0.598  0.768  0.786  0.734  0.845  0.853  0.782  0.809  0.824  0.635
  0.760  0.751  0.750  0.721  0.837  0.785  0.767  0.739  0.633  0.661]
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.883, per category = [ 0.900  0.852  0.919  0.825  0.919  0.933  0.892  0.899  0.867  0.868
  0.932  0.985  0.939  0.815  0.933  0.934  0.905  0.916  0.889  0.931
  0.920  0.925  0.945  0.924  0.650  0.905  0.790  0.905  0.882  0.938
  0.975  0.780  0.757  0.814  0.800  0.633  0.900  0.879  0.958  0.917
  0.929  0.908  0.932  0.838  0.857  0.922  0.881  0.887  0.910  0.894
  0.769  0.762  0.900  0.882  0.952  0.878  0.882  0.897  0.813  0.882
  0.885  0.917  0.890  0.933  0.922  0.893  0.907  0.939  0.900  0.795
  0.900  0.848  0.879  0.832  0.864  0.916  0.843  0.914  0.967  0.900]

解决篇

简直是大无语，博主在检查数据集时终于发现了问题：尽管在train是class损失已经降了下来，但在val时损失却总是居高不下，这不免让我产生了怀疑：难道是我的类别这块出现了问题，随后统计了下train与val中样本的数量：
很明显truck和car的train_num与val_num是不匹配的，这大概便是症结所在，再次查看数据集标注文件，果然是这里出现了问题，truck与car在val数据集中表反了。呜呜呜，搞了那么久，自己还在那乱想，原来是数据集出现了问题，啊啊啊啊。

在这里插入图片描述

随后重新制作了数据集，问题解决：

在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

DINO-DETR在COCO缩减数据集上实验结果分析的相关文章

(discord.py) 尝试更改成员角色时，“用户”对象没有属性“角色”

因此我正在尝试编写一个机器人让某人在命令中指定的主持人指定的一段时间内暂停角色我知道该变量称为小时即使它目前以秒为单位我稍后会解决这个问题基本上它是由主持人在消息暂停 personmention numberofhours
使用Python开发Web应用程序

我一直在用 python 做一些工作但这都是针对独立应用程序的我很想知道 python 的任何分支是否支持 Web 开发有人还会建议一个好的教程或网站吗我可以从中学习一些使用 python 进行 Web 开发的基础知识既然大家都说
InterfaceError：连接已关闭（使用 django + celery + Scrapy）

当我在 Celery 任务中使用 Scrapy 解析函数有时可能需要 10 分钟时我得到了这个信息我用姜戈 1 6 5 django celery 3 1 16 芹菜 3 1 16 psycopg2 2 5 5 我也使用了psyc
将字符串转换为带有毫秒和时区的日期时间 - Python

我有以下 python 片段 from datetime import datetime timestamp 05 Jan 2015 17 47 59 000 0800 datetime object datetime strptime t
Pycharm Python 控制台不打印输出

我有一个从 Pycharm python 控制台调用的函数但没有显示输出 In 2 def problem1 6 for i in range 1 101 2 print i end In 3 problem1 6 In 4 另一方面像
如何收集列表、字典等中重复计算的结果（或制作修改每个元素的列表的副本）？

There are a great many existing Q A on Stack Overflow on this general theme but they are all either poor quality typical
如何在android上的python kivy中关闭应用程序后使服务继续工作

我希望我的服务在关闭应用程序后继续工作但我做不到我听说我应该使用startForeground 但如何在Python中做到这一点呢应用程序代码 from kivy app import App from kivy uix floatl
DreamPie 不适用于 Python 3.2

我最喜欢的 Python shell 是DreamPie http dreampie sourceforge net 我想将它与 Python 3 2 一起使用我使用了添加解释器 DreamPie 应用程序并添加了 Python 3 2
如何在Windows上模拟socket.socketpair

标准Python函数套接字套接字对 https docs python org 3 library socket html socket socketpair不幸的是它在 Windows 上不可用从 Python 3 4 1 开始我
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
Python 中的二进制缓冲区

在Python中你可以使用StringIO https docs python org library struct html用于字符数据的类似文件的缓冲区内存映射文件 https docs python org library mmap
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
Python - 在窗口最小化或隐藏时使用 pywinauto 控制窗口

我正在尝试做的事情我正在尝试使用 pywinauto 在 python 中创建一个脚本以在后台自动安装 notepad 隐藏或最小化 notepad 只是一个示例因为我将编辑它以与其他软件一起使用 Problem 问题是我想在安装程序
通过数据框与函数进行交互

如果我有这样的日期框架氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例

随机推荐

#if defined 和 #if ! defined （C语言宏定义）

转自 http blog chinaunix net uid 26435987 id 3077444 html 因为对于一个大的程序而言我们可能会定义很多变量不管是放在源文件还是头文件那么我们在定义某个变量时我们就必须返回检查原来是
visual studio code的＜br/＞标签不好使的解决方案

刚开始是这样的加了b标签也不好使解决方案 File gt Preference gt Setting gt editor wordWrap 然后再运行就可以了
oracle查询执行过sql语句

一 oracle中查找某段时间执行的操作记录 select sql text module first load time from v sqlarea where first load time gt 2019 02 02 02 02 0
内存按字节编址，地址从A4000H到CBFFFH，共有多少个字节呢？

内存按字节编址地址从A4000H到CBFFFH 共有多少个字节呢若用存储容量为32K 8bit的存储器芯片构成内存至少需要多少片按字节编址 gt 一个存储单元大小是1B A4000H和CBFFFH是16进制数 H只是标志一个地址代
MySQL优化：从十几秒优化到三百毫秒

今天这篇文章还是记录问题的解决过程的昨天测试测试代码的时候发现一个功能需要大概十几秒的时间才能执行完我就去看自己的代码逻辑完整看了代码之后凭感觉导致时间长的原因有两部分一个是mysql的书写问题另一个可能是循环查询数据库的问题
C++ protobuf反射特征工程正确姿势

文章目录 1 1 Message 1 2 Descriptor 1 2 FieldDescriptor 1 2 Reflection 2 1 特征工程如何使用 3 1 初始化获取FiledDescriptor信息 3 2 实时获取对应的特征
C++数据结构之静态链表

1 静态链表的作用在有些早期的高级语言中并没有指针概念所以带有指针域的链表都无法在这些高级语言中使用于是出现了用一维数组代替指针来描述单链表这种一维数组描述的链表就被称为静态链表用以为数组的方式来表示链表因此拥有了数组的特性
System.ComponentModel.Win32Exception (0x80004005)：拒绝访问。——解决办法

一问题如下无法执行程序所执行的命令为 C Windows Microsoft NET Framework64 v4 0 30319 csc exe noconfig fullpaths C Windows TEMP 二背景部署在客
Spark on YARN两种运行模式的演示

前言前面搭建好了Spark on YARN环境接下来自然要使用这个集群发挥它的计算性能最常规的使用方式就是提交程序但由于Driver有两种运行方式导致了Spark on YARN也有两种运行模式 Cluster 集群和 Cli
图论基础之图中找环

对于有向图而言可以使用拓扑排序的方式找出图中的环 include
openwrt生成固件firmware过程

openwrt生成固件firmware过程 https blog csdn net viewsky11 article details 53097672 由于想看看生成各个文件系统格式文件的过程所以在Target Images中把ext4
[网络安全自学篇] 一.入门笔记之看雪Web安全学习及异或解密示例

最近开始学习网络安全相关知识接触了好多新术语感觉自己要学习的东西太多真是学无止境也发现了好几个默默无闻写着博客做着开源的大神准备好好学习下新知识并分享些博客与博友们一起进步加油非常基础的文章大神请飘过谢谢各位看官投票
计算机视觉基础（七）—— 一文解析Harris角点检测

在图像处理领域中特征点又被称为兴趣点或者角点它通常具有旋转不变性和光照不变性和视角不变性等优点是图像的重要特征之一常被应用到目标匹配目标跟踪三维重建等应用中点特征主要指图像中的明显点如突出的角点边缘端点极值点等等用于点
C#入门代码集25个

一从控制台读取东西代码片断 using System class TestReadConsole public static void Main Console Write Enter your name string strName C
小程序的拉流组件live-player的使用

前言我们在小程序中实现音视频直播录播的播放时候会使用到微信官方提供的两个组件推流组件和拉流组件这里来分享下他的拉流组件的使用和具体需要注意的点效果图 1 拉流状态code日志 2 代码使用截图官方文档 live playe
帮我写爬取考研资料的代码

我可以提供一些参考代码帮助您爬取考研资料加载必要的库 import requests from bs4 import BeautifulSoup 设置网址 url http example com exam data 获取网页源代码 re
vue动态添加路由,element-admin后台路由

很多后台项目的菜单都是可配置的所以需要从后台取到菜单数据并加到路由映射用 1 第一步将后台数据转换成vue router 需要的数据格式以下是路由格式 declare type RouteConfig path string 路径 c
c/c++编程日记：用C语言实现消消乐游戏（附源码）

描述给定一个矩阵判断移动哪一个格子可以实现消除定义连续三个即可消除分析先写一个函数判断包含 i j 的格子是否可能实现消除然后就是向右向下交换然后调用上面写好的函数判断被交换的两个格子是否实现消除重点 1 只需要向右向
关于IDEA中Spring配置文件中的提示：File is included in 4 contexts

关于IDEA中Spring配置文件中的提示 File is included in 4 contexts 今天在学习SpringMVC框架的时候由于web xml中需要绑定Spring的配置文件在配好Spring的配置文件并运行Tomc
DINO-DETR在COCO缩减数据集上实验结果分析

问题篇博主在进行DINO DETR模型实验时使用缩减后的COCO数据集进行训练发现其mAP值只能达到0 27作用故而修改了下pycocotool的代码令其输出每个类别的AP值来看看是由于什么原因导致这个问题之所以这样是因为博主

DINO-DETR在COCO缩减数据集上实验结果分析

问题篇

解决篇

DINO-DETR在COCO缩减数据集上实验结果分析 的相关文章

随机推荐

热门标签

DINO-DETR在COCO缩减数据集上实验结果分析的相关文章