目录
1.anchor的计算机制
2.anchor对应机制
3.网络结构
4.训练过程
5.测试过程
1.anchor的计算机制
![](https://img-blog.csdnimg.cn/20210920202028604.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA5L2b57O76LCD5Y-C,size_20,color_FFFFFF,t_70,g_se,x_16)
![](https://img-blog.csdnimg.cn/20210920203352622.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA5L2b57O76LCD5Y-C,size_20,color_FFFFFF,t_70,g_se,x_16)
![preview](https://imgconvert.csdnimg.cn/aHR0cHM6Ly9waWMyLnpoaW1nLmNvbS92Mi1lZDI4OTAzZDdiOTQzMDVhODcwNjg4NmJjYWExY2JkMV9yLmpwZw)
- 锚框anchor是真值框和预测框之间的桥梁:预测框在锚框基础上,预测出框的大小,锚框和实际框通过IoU进行关联
- 网络直接预测的是特征图中当前单元格相对于锚框的偏置tx,ty,tw,th,然后通过下面关系式计算得到bx,by,bw,bh(真值标签也是bx,by,bw,bh四个值,从而计算loss)
![](https://img-blog.csdnimg.cn/20190801105904839.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3l6eV9femp1,size_16,color_FFFFFF,t_70)
上式中:
即为预测的边界框bounding box在feature map中的中心点坐标和长宽;
即为网络学习的相对于先验框(prior,anchor)的offsets;-
是各个单元格的左上点坐标(即先验框中心点的参考点为单元格的左上顶点);
即为先验框(prior,anchor)相对于特征图尺度的长和宽
若我们需要得到预测框相对于原图的坐标实际值,则只需要将
乘以该特征图的降采样倍数,如8,16,32等。
anchor的调整可视化
以13x13特征图大小为例,如下图所示,各个点为单元格的顶点,左图是以黑色顶点为中心的三个anchor,右图是三个anchor调整后的结果,即三个预测框,红点为三个预测框的中心点。
![](https://img-blog.csdnimg.cn/7ce4fd71204b4cf5bcf927cafacf552b.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBA5L2b57O76LCD5Y-C,size_20,color_FFFFFF,t_70,g_se,x_16)
2.anchor对应机制
- 一个单元格有3个锚框,在计算Loss时并不是三个锚框对应的预测框都与真值框进行比较,而是只采用1个预测框进行计算diff,即:采用与真值框之间IOU最大的锚框所对应的预测框进行计算,忽略另外2个预测框
![](https://img-blog.csdnimg.cn/20210920204604554.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA5L2b57O76LCD5Y-C,size_20,color_FFFFFF,t_70,g_se,x_16)
3.网络结构
![](https://img-blog.csdnimg.cn/20210920213532948.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA5L2b57O76LCD5Y-C,size_20,color_FFFFFF,t_70,g_se,x_16)
![](https://img-blog.csdnimg.cn/20210920213939803.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA5L2b57O76LCD5Y-C,size_20,color_FFFFFF,t_70,g_se,x_16)
- ResUnit与Resnet18类似,依次为1x1卷积3x3卷积,然后相加add
- ResX中第一个CBL为stride=2的卷积,进行降采样操作
4.训练过程
![](https://img-blog.csdnimg.cn/20210920214401846.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA5L2b57O76LCD5Y-C,size_20,color_FFFFFF,t_70,g_se,x_16)
5.测试过程
![](https://img-blog.csdnimg.cn/20210920214515591.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA5L2b57O76LCD5Y-C,size_20,color_FFFFFF,t_70,g_se,x_16)
参考:目标检测YOLO系列
江大白:YOLOV3(下)
睿智的目标检测26—Pytorch搭建yolo3目标检测平台
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)