yolov3整体工作流程（个人理解，欢迎纠正和补充）

2023-11-13

以下内容纯属个人理解，请路过的小伙伴留下宝贵意见，欢迎纠正和补充，谢谢

yolov3的总体思想归纳：

首先，将输入图片压缩到416×416，通过特征提取网络（Darknet53 without FC layer）对输入图像提取特征得到大小一定的特征图，比如13×13，然后将输入图像分成13×13个网格（grid cells），接着如果GT中某个目标的中心坐标落在哪个grid cell中，那么就由该grid cell来预测该目标。每个grid cell都会预测3个边界框。预测得到的输出特征图共有三个维度，第三个维度是深度。

Yolov3输出了三个不同尺度的特征图。采用多尺度对不同大小的目标进行检测，越精细的grid cell就可以检测出越精细的物体。三个尺度的深度都是255（3×（5+80））。

根据图来说明过程：

流程：首先输入尺寸416×416，然后进入darknet特征提取网络，右边图（不算分支，也是左边图虚线中内容），其中经过五次下采样，还是用了残差结构，目的是使网络结构在很深的情况下，仍能收敛，继续训练下去。然后到左边图，虚线中输出的尺寸是13×13，然后在经过DBL特征提取，以及最后蓝色的卷积（我猜是用来代替全连接分类的），输出第一个尺度13×13。

接着用虚线输出的特征图经过DBL后的13×13的特征图上采样后与倒数第二次下采样的结果相加，二者都为26×26，然后在进行和尺度一同样的后续操作。

最后是26×26的特征图上采样后与倒数第三次下采样的特征图相加，即还为26×26，在进行后续操作。

总的来说会输出3个不同尺度的特征图，每个尺度的特征图负责预测不同大小的目标。每个特征图对应3种anchor大小不同的负责预测目标。最初图像还被分成13×13个网格，目标落在哪个网格中，哪个网格就负责预测目标，一个网格对应3个anchor（anchor的尺寸根据特征图相对于原图的比例等比缩小）。

预测时，yolov3采用多个独立的逻辑分类器来计算属于特定标签的可能性，在计算分类损失时，它对每个标签使用二元交叉熵损失，降低了计算的复杂度。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习

YOLOv3整体工作流程

yolov3整体工作流程（个人理解，欢迎纠正和补充）的相关文章

Java 关于时间、日历类

一相互转换 1 Calendar 转化 String 获取当前时间的具体情况如年月日 week date 分秒等 Calendar calendat Calendar getInstance SimpleDateFormat sd
打印金字塔

首先我们分解这个问题由简到难循序渐进先打印4层半个金字塔如图 public class demo1 打印半个金字塔 public static void main String args TODO Auto generated meth
深度解析开源IDE的领头羊—【Eclipse 】--认识Eclipse

认识Eclipse 阅读本文前相信读者已经对Eclipse略知一二了起码已经知道它是一个Java的集成开发环境 IDE 并且还是一个应用程序框架可以通过开发插件把Eclipse打造成各种应用软件而且还打算通过学习本书的内容在具体
vue2 webpack版批量注册全局组件

使用背景用vue开发的所有项目都是采用组件化的思想开发的分为公共组件和功能组件又可以分为全局自定义组件和局部自定义组件全局自定义组件在main js文件直接引入这种是最简单的方式使用缺点如果我们需要注册的全局组件非常多那么
移动端 - 搜索组件(search-list篇)

移动端搜索组件 search input篇移动端搜索组件 suggest篇这里我们需要去封装搜索历史组件这一个组件还是很简单的但是逻辑部分需要根据实际的需求来进行书写所以这里我不太好去写实际的代码不过可以提供我的思路主要的
Spring的事务

目录一 Spring的事务二 Spring事务如何实现三 Spring事务的失效一 Spring的事务当我们在某个方法上添加了 Transactional注解后就表示该方法在调用时会开启Spring事务而这个方法所在的类所对应

随机推荐

第九课，OpenGL光照之材质

物体材质在冯氏模型中一个物体的材质由全局光照系数漫反射光照系数反射光照系数反射高光半径系数决定分别由 ambient diffuse specular shininess表示材质系数 The numbers Name Amb
【博客管理】博客目录导航【置顶】

一 OpenCV学习 OpenCV学习笔记函数学习 OpenCV学习笔记函数学习一 MFC OpenCV2 4 7读取摄像头之cvCaptureFromCAM 的索引问题 OpenCV学习笔记函数学习二 MFC OpenCV2 4
【华为OD机试2023】字符串解密 java python c++

字符串解密题目题目描述给定两个字符串string1和string2 string1是一个被加扰的宇符串 string1由小写英文字母 a z 和数字字符 0 9 组成而加扰字符串由 0 9 a z 组成 string1里面可能包含0
使用js控制浏览器开启全屏，判断浏览器是否处于全屏状态

引入lodash import from lodash 切换全屏方法 export function fullScreen isOpen target let dom target void 0 let open list requestF
什么是.Net？

NET 是一个开发平台或者叫开发者平台使用 NET 你可以创建不同类型的应用程序使用多种开发语言编辑器和工具库创建网页手机桌面以及游戏等应用其核心特点是免费开源和跨平台 1 语言和平台我们先来理解一下什么是 NET 开发
URL 转为QR code（二维码）

总结几种把网页url转为二维码的方法 1 Chrome浏览器最快的一种方法就是用chrome自带的QR code分享这种方法的缺点就是不能自定义二维码的格式颜色 logo之类的都是默认的小恐龙图标 2 chrome插件可以在chr
关于非同一局域网下两台设备之间的网络通信（服务器的作用）

看过很多关于局域网下的两台设备之间的通信方式最多的就是通过socket进行tcp ip通信建立一个服务端再建立一个客户端客户端向服务端发起请求连接然后再进行两端的通信但发现其实这却存在着很多的问题与不足如果是不在同一局域网下的
新手搭建 react antd 环境笔记

安裝依赖 npm install g create react app npm install antd mobile save npm install less loader less save dev npm install react
LeetCode【345】反转字符串中的元音字母

题目编写一个函数以字符串作为输入反转该字符串中的元音字母示例 1 输入 hello 输出 holle 示例 2 输入 leetcode 输出 leotcede 说明元音字母不包含字母 y public class LeetCode
linux system call

1 SYSCALL DEFINE4 reboot 2 int magic1 3 int magic2 4 unsigned int cmd 5 void user ang 6 7 if capable CAP SYS BOOT 8 retu
python数据分析练习题

本次作业尝试使用ipython和jupyter的notebook功能来实现py代码首先是要配置环境通过命令 pip install ipython pip install jypyter ipython notebook 配置并打开no
[机器学习]1.2虚拟环境&基础包安装初始化

机器学习第一章 Centos环境安装初始化第二章 virtualenv及基础包环境安装初始化机器学习 1 2虚拟环境基础包安装初始化机器学习前言一 python安装二 pip3 virtualenv安装及环境变量配置 1 配
08 FPGA—计数器与分频器的应用

1 理论时序逻辑电路中最基本的单元寄存器我们可以使用寄存器来做计数器基本上关于时间的设计都离不开计数器计数器在数字系统中主要是对脉冲的个数进行计数以实现测量计数和控制的功能同时兼有分频功能计数器一般都是从 0 开始计数计
第四章-图像加密与解密

加密与加密原理使用异或运算实现图像加密及解密功能异或运算规则相同为0 不同为1 运算数相同结果为0 运算数不同结果为1 任何数 0 1 与0异或结果仍为自身任何数 0 1 与1异或结果为另外一个数即0变1 1变0 任何数和
Ubuntu查看系统日志的几种方法

在 Ubuntu 22 10 中你可以查看系统日志来排查错误以下是几种查看日志的方法一 Journalctl 命令使用 journalctl 命令可以查看系统日志信息包括引起闪退的错误信息你可以运行以下命令来查看最新的系统日志
GDAL根据Shape文件切图（java）

目地用Java实现类似QGIS中按掩膜图层裁剪栅格的功能其实QGIS本身调用的就是gdalwarp exe 官方文档 https gdal org programs gdalwarp html gdalwarp gdalwarp h
js == 运算规则解析

1 先了解一下基本类型和复杂类型划分的依据 JS中的值有两种类型原始类型 Primitive 对象类型 Object 原始类型包括 Undefined Null Boolean Number和String等五种这两大类别的数据存储方式是
启明智显分享

提示作为Espressif 乐鑫科技大中华区合作伙伴及sigmastar 厦门星宸 VAD合作伙伴启明智显不仅用心整理了你在开发过程中可能会遇到的问题以及快速上手的简明教程供开发小伙伴参考同时也用心整理了乐鑫及星宸科技的新产品新方
软文营销研究目标关键词让内容简单明了

随着行业的发展许多企业正在进入文案领域对于喜欢写作的人来说这是一条很好的道路但对某些人来说也可能具有挑战性一些初学者可能会觉得自己没有写作能力达不到标准因此本文178软文网小编将帮你决定并学习如何成写出一篇成功有效的文案一向
yolov3整体工作流程（个人理解，欢迎纠正和补充）

以下内容纯属个人理解请路过的小伙伴留下宝贵意见欢迎纠正和补充谢谢 yolov3的总体思想归纳首先将输入图片压缩到416 416 通过特征提取网络 Darknet53 without FC layer 对输入图像提取特征得到大小一定

热门标签