小物体的目标检测的研究综述

2023-11-01

关于小目标检测算法的研究综述

  1. 小目标研究的难点
  2. 小目标研究算法的现状
  3. 自己对于小目标算法的理解

小目标检测的难点

  1. 在我们平常的数据集中,大多数都是中等和偏大的物体,小目标属性相对偏少
  2. 小目标在原始图像中一般只占0.02-0.05左右,而我们做目标检测任务时通常会用卷积网络去提取图片的特征,卷积到最后往往特征图就会变得非常小。这个时候物体的位置信息就会非常的不明显
  3. 背景噪声对于小目标来说影响很大

小目标检测研究的现状

在目前的研究中,基本都是采用特征融合的方式,即将浅层特征图和深层特征图做一个特征融合。主要原因就是浅层的特征图对于物体有更好的位置信息,而深层的特征图对于物体有更强的语义信息。
下面就针对我近期读的论文来梳理一下目前研究的现状。

《Small Object Detection using Context and Attention》
这篇文章主要贡献就是将上下文信息和注意力结合起来。这篇文章的作者认为由于分辨率低,像素有限,小目标检测很困难。例如,通过只看下图上的目标,人类甚至很难识别这些物体。然而,通过考虑到它位于天空中的背景,这个物体可以被识别为鸟类。因此,作者认为,解决这个问题的关键取决于如何将上下文作为额外信息来帮助检测小目标。框架如下图所示:
在这里插入图片描述
首先,SSD与特征融合,以获取上下文信息,名为F-SSD;然后A-SSD就添加了注意力模块,最后一幅图就是把他两结合了起来。
对于他上下文信息的具体做法是将目标层和他更高层次的特征图融合。如下图所示:
在这里插入图片描述
接下来就是《Augumentation for small object detetction》
这篇文章的主要思想就是对小目标样本进行过采样,然后对样本里的小目标进行复制粘贴,以此来提供足够的小目标来和anchor进行匹配,以此实现提高小目标检测的性能。
作者提出了三种复制粘贴小目标的方式:

  1. 图像中选择一个小目标,然后在随机位置复制粘贴多次
  2. 图像中选择许多小目标,并在任意位置复制粘贴它们一次
  3. 图像中所有的小目标在任意位置复制粘贴多次

接下来是《D-SSD》这篇文章
先把他的模型图贴出来,他的主要思想看模型图一看就能看明白
在这里插入图片描述
上一半是普通的SSD网络模型,下一半是加入了反卷积后的网络。主要做法就是将深层特征图进行反卷积后得到原来特征图的大小,之后将他们两个进行特征融合,但是这里特征融合的方法是进行对应位置的点乘。
最后一篇是《R-SSD》,它的主要思想如下图所示
在这里插入图片描述
这是一种新的特征融合方式,a图是将浅层特征图先做pooling,和下一层的特征图一样大,然后做concate,然后递归做下去,从左至右。而b图则是从最小的1*1的紫色future map往左做concate,因为deconvolution是升维,所以顺序是从右到左。作者认为前两种特征融合的方式的缺点在于信息的传递都是单向的,这样分类网络就没法利用其他方向的信息,因此有了c,同时从左至右和从右至左。细节是在做concate之前都会对feature map做一个normalization操作,因为不同层的featur额map的scale是不同的。

自己对于小目标检测算法的理解

现阶段对于小目标检测,无非就是像金字塔类型的特征融合,只不过特征融合的方法有很多种,但是都是浅层和深层的进行融合。再然后就是结合上下文信息,这个也有很多不同的实现方法,比如几个连续的特征层融合,特征图平均池化。。。之后就是生成对抗网络,这是一种可以增加图片分辨率的一种方法。我个人的创新点在于如何消除背景对于小目标的噪声。初始做法是看做一个二值化能不能消除掉背景,将所要检测的目标更突出,,但是还没有试验,效果等待检验

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

小物体的目标检测的研究综述 的相关文章

  • React路由基础

    React路由 路由使用步骤 编程式导航 路由使用步骤 安装 npm i react router dom D 引入并使用 1 引入路由 import BrowserRouter as Router Route Link from reac
  • 计算机网络实验路由器配置

    路由器配置实验 实验目的及要求 认识路由器的端口 型号 2 掌握路由器的路由配置 理解网络互联的基本原理 实验环境 Packet Tracer V6 实验内容 路由器接口的配置 静态路由配置 默认路由配置 动态路由配置 实验步骤 1 路由器
  • React 函数组件和类组件的优缺点

    React 函数组件和类组件的优缺点 React中的组件可以分为函数组件和类组件 它们各自有一些优缺点 下面是一些常见的观点 函数组件的优点 定义和使用较简单和直观 只需要一个函数即可 对于简单的组件 可以使用函数组件来提高性能和简化开发
  • Arena仿真-基于超市排队的建模分析

    文章目录 Arena仿真作业 一 问题介绍 1 1 模型假设 1 2 优化目标 1 3 约束条件 二 模块设计 2 1 Create模块 2 2 Decide模块 2 3 Assign模块 2 4 Process模块 2 5 Dispose
  • element UI 穿梭框按钮样式修改

    利用Element UI 修改穿梭框的按钮样式 html部分
  • filter 方法常用过滤条件

    encoding utf 8 from sqlalchemy import create engine Column Integer String Float func and or from sqlalchemy ext declarat
  • Java Arrays.sort()自定义排序方法

    Java Arrays sort可以对很多数据类型进行排序 但是当需要对一个比较特殊的数组进行排序的时候 比如一个二维数组 我们要以每组的第一个数大小来排序 则需要我们自己定义一个比较方法 先看看源码 public static
  • 重学Java(四):操作符

    之前我写了一篇 重学Java 四 对象 引用 堆 栈 堆栈 本以为凭借自己8年的Java编程经验足够把这些 吃人 的Java名词解释清楚了 但有网友不以为然 在文章底部评论说 老哥 你真的有8年java开发经验么 告诉我 为什么要用三个句号

随机推荐

  • SylixOS系统简介

    SylixOS是一款嵌入式硬实时操作系统 同其类似的操作系统 全球比较知名的还有VxWorks 主要应用于航空航天 军事与工业自动化领域 RTEMS 起源于美国国防部导弹与火箭控制实时系统 ThreadX 主要应用于航空航天与数码通讯 等
  • 正确理解MySQL的MVCC及实现原理

    MVCC多版本并发控制 目录 MVCC多版本并发控制 前提概要 什么是MVCC 什么是当前读和快照读 当前读 快照读和MVCC的关系 MVCC的实现原理 隐式字段 undo日志 Read View 读视图 整体流程 MVCC相关问题 RR是
  • GlobalCorsConfig跨域文件

    package com config import org springframework context annotation Bean import org springframework context annotation Conf
  • Zabbix的基本使用

    文章目录 一 认识Zabbix 1 简介 2 功能 3 架构 4 数据流 二 项目 1 软件安装和环境部署 2 Zabbix工具的使用 1 创建被控主机 2 中文乱码修复 3 自动发现主机 4 自动注册主机 3 zabbix的API调用 4
  • Pandas中DataFrame的基本操作(增删)

    这是一篇最基础的Pandas用法总结 也方便自己日后进行复习与查询 这一次我们来总结一下Pandas中的一些增删改基本操作 df pd DataFrame F 90 88 85 M 75 97 74 F 82 73 91 M 93 99 9
  • Nginx的rewrite重写跳转和location匹配

    目录 常用的Nginx 正则表达式 location大致可以分为三类 location 常用的匹配规制 location优先级 location示例说明 实际网站使用中 至少有三个匹配规则定义 第一个必选规则 第二个必选规则是处理静态文件请
  • 设计模式-01-模糊理解

    一 概念 设计模式 别人都说它们就像是一个个的模型胚子 不管你们是多么的杂乱无章 只要经过它们的改造 表现出来的就都会是工工整整 标标准准的 而我觉得更确切的比喻应该是像一个制砖块儿的模具 虽然我们不知道为什么砖块儿 不仅要结实 也要外表光
  • python换零钱_Python3算法实例 1.2:动态规划 之 换零钱

    money jpg 问题 基础版 把100元兑换成1元 2元 5元 10元 20元 50元的零钱 共有多少种不同换法 动态规划思想解析 拆解子问题 下面以5元换成1 2 3元的零钱为例 T change target 表示用零钱序列chan
  • mybatisPlus之getById和selectById查询不出结果

    最终导致查询不出结果的原因可能有多种 我这里说出我遇到的一种原因 希望对你有帮助 我是因为在数据库添加了一个字段 没有及时地更新mapper xml中的resultMap导致的 大晚上的写代码 脑子不太好使 2 最近又遇到了一种情况 我数据
  • C 语言设置 Console 文字和背景的颜色的方法

    最近写的一个程序需要在 Console 窗口中输出大量的信息 大量的信息混在一起看着实在是费劲 因此就想到不同的信息用不同的颜色来输出 上网查了一番 win32 API 中有一个函数 SetConsoleTextAttribute 可以做这
  • 【目标检测】49、YOLOF

    文章目录 一 背景 二 方法 2 1 使用 SiSo 代替 MiMo 2 2 使用 Uniform matching 代替 Max IoU matching 2 3 YOLOF 的结构 三 效果 论文 You Only Look One l
  • linux常用命令-part2

    Ubuntu Fedora Debian CentOS中文怎么发音 有奔头 费德勒 迪扁 桑托斯 乌版图 菲朵拉 德槟 森头斯 使用find和wc命令统计代码行数 wc l find name js xargs 查看当前目录下文件的个数 l
  • 【用YOLOv3-tiny对TT100K进行训练】

    用YOLOv3 tiny对TT100K进行训练 数据集的处理 TT100K YOLO Label代码如何使用 修改数据集的配置文件 开始训练 训练意外中断怎么办 第一次跑代码 过程艰辛 值得记录 数据集的处理 YOLO对于数据集标签的格式有
  • oracle11g在没DNS情况下failover的配置方法

    1 Oracle 11g引入scan ip 可在没有DNS的情况下 客户端连接RAC配置failover时 很多情况还是使用oracle10g方式 即在客户端tnsname ora中配置failover 1 当客户端配置如下时 连接的实例关
  • 直线电机原理动画_直线振动筛工作原理结构图以及结构解析

    很多用户在使用直线振动筛的时都没有好好的研究过 该设备有哪些结构特点 从而造成了很多的使用上的问题 那么今天小编就为大家简单的介绍一下 如下所示 1 工作原理 直线振动筛为双电机驱动 利用电机里的偏心块的振动带动筛网和物料的振动 从而完成物
  • python summary结果提取_从Python中的OLS Summary获取DurbinWatson和JarqueBera统计信息

    OLS是一个运行值的汇总列 OLS的一部分是Durbin Watson和Jarque Bera JB 的统计数据 我想直接提取这些值 因为它们已经被计算出来了 而不是像我现在对durbinwatson那样运行这些步骤 在 下面是我的代码 i
  • 【力扣】455、分发饼干

    var findContentChildren function g s g 孩子的胃口 s 饼干尺寸 let arr g sort a b gt return a b let brr s sort a b gt return a b 初始
  • 【Flutter】十八、Flutter中常用的布局容器——列表布局ListView、ListTile

    一 ListView 1 1 创建ListView的多种方式 1 1 1 ListView 1 1 2 ListView builder 1 1 3 ListView separated 1 1 4 ListView custom 二 Li
  • 【P186 20】C++ 容器快速入门 (vector、deque、list、map、set...)(超详细)

    P186 20 C 容器快速入门 一 vector容器 1 vector存放内置数据类型 1 六种遍历方式 六种遍历方式 完整代码总览 部分遍历详解 2 初始化 区别 1 默认初始化 无参 没给定数组大小 2 带参数构造初始化 给定数组大小
  • 小物体的目标检测的研究综述

    关于小目标检测算法的研究综述 小目标研究的难点 小目标研究算法的现状 自己对于小目标算法的理解 小目标检测的难点 在我们平常的数据集中 大多数都是中等和偏大的物体 小目标属性相对偏少 小目标在原始图像中一般只占0 02 0 05左右 而我们