ROI Pooling层详解

2023-11-06

ROI Pooling层详解

原文链接：https://blog.deepsense.ai/region-of-interest-pooling-explained/

目标检测typical architecture 通常可以分为两个阶段：

（1）region proposal：给定一张输入image找出objects可能存在的所有位置。这一阶段的输出应该是一系列object可能位置的bounding box。这些通常称之为region proposals或者 regions of interest（ROI）。

（2）final classification：确定上一阶段的每个region proposal是否属于目标一类或者背景。

这个architecture存在的一些问题是：

产生大量的region proposals 会导致performance problems，很难达到实时目标检测。
在处理速度方面是suboptimal。
无法做到end-to-end training。

这就是ROI pooling提出的根本原因。

ROI pooling层能实现training和testing的显著加速，并提高检测accuracy。该层有两个输入：

从具有多个卷积核池化的深度网络中获得的固定大小的feature maps；
一个表示所有ROI的N*5的矩阵，其中N表示ROI的数目。第一列表示图像index，其余四列表示其余的左上角和右下角坐标；

ROI pooling具体操作如下：

（1）根据输入image，将ROI映射到feature map对应位置；

（2）将映射后的区域划分为相同大小的sections（sections数量与输出的维度相同）；

（3）对每个sections进行max pooling操作；

这样我们就可以从不同大小的方框得到固定大小的相应的feature maps。值得一提的是，输出的feature maps的大小不取决于ROI和卷积feature maps大小。ROI pooling 最大的好处就在于极大地提高了处理速度。

ROI pooling example

考虑一个8*8大小的feature map，一个ROI，以及输出大小为2*2.

（1）输入的固定大小的feature map

（2）region proposal 投影之后位置（左上角，右下角坐标）：（0，3），（7，8）。

（3）将其划分为（2*2）个sections（因为输出大小为2*2），我们可以得到：

（4）对每个section做max pooling，可以得到：

ROI pooling总结：

（1）用于目标检测任务；（2）允许我们对CNN中的feature map进行reuse；（3）可以显著加速training和testing速度；（4）允许end-to-end的形式训练目标检测系统。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习

ROI Pooling层详解

目标检测

RCNN系列

ROI Pooling层详解的相关文章

扩展欧几里得算法

扩展欧几里得算法是啥那就要先知道什么是欧几里得算法欧几里得算法扩展欧几里得算法是欧几里得算法的推广利用欧几里得算法的思想和递归求得贝祖等式a x b y gcd a b 不定方程中的一组x和y的解原理如下设a gt b 当b 0
Coqui TTS 安装与测试

前言本篇记录一下 Coqui TTS 的安装 Coqui TTS 的主要作者是德国人这个库似乎之前和 Mozilla 的 TTS https github com mozilla TTS 有千丝万缕的关系但是现在后者的 TTS 已经停
2021年江苏省职业院校技能大赛中职 “网络信息安全”赛项（超详细）

2021年中职组网络空间安全赛项一江苏省竞赛任务书二任务书解析三不懂的可以私信博主一江苏省竞赛任务书一竞赛时间 8 00 11 00 共计3小时二竞赛阶段竞赛阶段任务阶段竞赛任务竞赛时间分值第阶段
[附源码]计算机毕业设计Python课程在线测评系统(程序+源码+LW文档)

该项目含有源码文档程序数据库配套开发软件软件安装教程项目运行环境配置 Pychram社区版 python3 7 7 Mysql5 7 HBuilderX list pip Navicat11 Django nodejs 项目技
一文理解pytorch张量概念和tensor的三种创建方式！

1 张量是什么张量是一个多维数组它是标量向量矩阵的高维拓展 1 1 Variable Variable是 torch autograd中的数据类型主要用于封装 Tensor 进行自动求导 data 被包装的Tensor grad
超实用的IDEA插件推荐，百万级下载量

超实用的30多款idea插件有百万级下载量的优秀插件你值得拥有好的工具助你事半功倍快速协助敲出更漂亮更有效率的代码搬运工这里收集了很不错的IDEA插件相信你一定会喜欢的必备插件列表 Grep Console 自定义控制台输出格
C#常用代码

最近学习用C 写了几个程序记录一下常用的几个操作方便以后Copy 文件操作 FileStream fs null try byte buf FileStream fs new FileStream strSampleFileName F

随机推荐

Ubuntu16.04下opencv2与ROSkinetic中自带opencv3不兼容问题总结

1 背景从ROSindigo换到ROSkinetic ROSkinetic中自带的opencv3 与原来indigo中opencv2不一样所以原来的涉及opencv的程序都出了问题最近这两天就一直在改兼容性清明节最后一天了总结一下
WebStorm2016.2 注册码及激活，2018.6.14亲测有效

License server激活这可能是最简单的了在激活框选择 License server 输入 http idea iteblog com key php 2018 6 14可用
table自定义表格的封装

前言对原生的table进行封装让他满足我们一行显示不同个的需求实现效果如图所示一行显示不同数量的内容实现代码 1 封装的组件 custom table vue 源码看下面 1 一行显示几个td 2 表头数据表格数据 3 js封
深度学习python图像标记工具labelTool

深度学习训练需要标记图像位置和类别之前用的时候是叫做BBox Label Tool master 遇到大图像就显示不完整了没有自适应缩放这是改进后的Python脚本目录结构图片目录名images 标签目录名labels 图像目录下
JDK 新特性篇：JDK 8 新特性详解

Java8新特性简介 Java 8 又称为 JDK 1 8 是 Java 语言开发的一个主要版本 Java 8 是 Oracle 公司于 2014 年 3 月发布可以看成是自 Java 5 以来最具革命性的版本 Java 8 为 Java
函数重载和缺省参数

函数重载 C 允许在同一作用域类声明几个功能类似的同名函数但是这些同名函数的形式参数指参数的个数类型或者顺序必须不同也就是说用同一个运算符完成不同的运算功能函数重载必须是参数的个数或者类型不同与返回值无关在C语言当中是不支持
李宏毅机器学习——梯度下降详细讲解

文章目录梯度下降 1 学习率 1 1自适应学习率 1 2 Adagrad算法 2 随机梯度下降 3 特征缩放 3 1 特征缩放原因 3 2 特征缩放方法 4 梯度下降的限制梯度下降梯度下降是为了解决回归方程中参数的最优化问题即表现为
STM32F446+OLED12864做贪吃蛇游戏

上面是我的微信和QQ群欢迎新朋友的加入闲暇之余发现看了下OLED12864的数据手册发现他的显示在Y轴上只有页写也就是一次写8个点突然想到如果自己程序需要精准定位到某个点那这不是会很艹蛋么去网上搜索基本上都是页写的代码也
mysql 自动备份(windows 环境）

windows环境设置mysql自动备份测试成功要实现数据库的自动备份就需要一下两步一利用MySQL提供的备份命令mysqldump 结合Windows的任务计划程序实现步骤编写脚本说明该脚本不会关闭数据库并且可以按每一天
C#强制杀进程

通过cmd命令实现 using System using System Collections Generic using System Linq using System Text using System Threading Tasks
小波矩特征提取matlab代码

这是我上研究生时写的小波矩特征提取代码新归一化方法小波矩特征提取 F imread a1 bmp F im2bw F F imresize F 128 128 求取最上点for i 1 128 for j 1 128 if F i j 1
AVPlayer 播放在线视频和本地文件的设置区别

http blog csdn net u012671808 article details 30500595 comments
动态文件版通讯录及C语言中的文件的读写操作

上一期我们编写了一个C语言版本的简易通讯录但是我们的之前的通讯录是没有记忆功能的也就是说一旦关闭了程序我们存储在里面的数据也就消失了那么今天我们就来实现一个附带数据储存的通讯录在此之前我们先来了解一下C语言中文件的读写函数 1
QT-通过控件ObjectName获取控制

QT 通过控件ObjectName获取控制示例 1 说明解释示例 1 说明解释代码如下 QString strObjectName QString lineEditDev5IP QLineEdit pLineEdit this gt
KVM中的ballooning详解

KVM中的ballooning详解 1 Ballooning简介通常来说要改变客户机占用的宿主机内存是要先关闭客户机修改启动时的内存配置然后重启客户机才能实现而内存的ballooning 气球技术可以在客户机运行时动态地调整它
kibana数据导入导出_怎么实现kibana的数据导入导出

匿名用户 1级 2016 10 19 回答 logstash好说 client只需要在代码逻辑改下redis地址就可以了 logstash server直接docker pull镜像就可以了 elasticsearch需要我们自己写脚本迁移
机器翻译深度学习预处理实战（中英文互译）一

深度学习预处理实战中英文互译文章目录深度学习预处理实战中英文互译前言一获取中英互译的数据集二具体步骤 1 首先引入相关库 2 中英文预处理 3 主函数运行前言基于深度学习的机器翻译学习分为三步 1 解决自动将一种自然语
python获取指定时间段内特定规律的日期列表

前言写小程序时遇到个需要自定义回归时间的场景下面是实现的效果图于我需求而言我只需要用到fixed interval weekly per month三个方法返回的回归间隔列表就行最后的这个make date from list方
开源软件选型分析标准【转载】

http wenku baidu com view 0f4acf88cc22bcd126ff0ca2 html re view 1 标准和目标 1 1前言目前开源的网管软件众多时间关系只能通过网络上的资料介绍和其他用户的体验进行评估对于
ROI Pooling层详解

ROI Pooling层详解原文链接 https blog deepsense ai region of interest pooling explained 目标检测typical architecture 通常可以分为两个阶段 1 r

ROI Pooling层详解

ROI Pooling层详解 的相关文章

随机推荐

热门标签

ROI Pooling层详解的相关文章