目标检测之一（传统算法和深度学习的源码学习）

2023-05-16

本系列写一写关于目标检测的东西，包括传统算法和深度学习的方法都会涉及到，注重实验而不着重理论，理论相关的看论文去哈，主要依赖opencv。

一、目标检测有哪些算法，历史简介

最近在做一些目标检测相关的东西，目标检测是计算机视觉里面最重要的课题之一了，很多场合检测和识别都是很重要的，比如现在很火的无人驾驶，就非常依赖目标检测和识别，需要非常高的检测精度和定位精度。

目标检测从很早就开始有了。

传统算法的典型代表有：

Haar特征+Adaboost算法

Hog特征+Svm算法

DPM算法

深度学习的目标检测典型代表有：

RCNN系列，RCNN，spp-net，fast-rcnn，faster-rcnn

YOLO系列，YOLO和YOLO9000

SSD

后来有了深度残差网络ResNet之后，又出现了RFCN，还有最近的mask-rcnn等等，检测效果越来越好，精度越来越高。

二、Haar特征+Adaboost特征检测

作为本系列的第一篇，先来点简单的，我们从Haar特征+Adaboost算法开始。原理很简单。网络上教程一大堆，我这里就不废话了，稍微提下下。

Haar特征有以下几种：

Adaboost算法是机器学习里面的一种集成学习的算法，说的通俗点，就是用弱分类器（分类能力较差，但是也要大于0.5）级联加权组合成强分类器（分类能力较强），在训练过程中会着重训练前面分类错误的样本，及具体做法是增加样本对应的权重。

本次实验检测目标为车辆

使用Haar+Adaboost算法目标检测分为三个步骤：

1、样本的创建和标记

2、训练分类器

3、利用训练好的分类器进行目标检测。

1. 样本的创建和标记

自己做样本是一个非常痛苦和麻烦的事，最好还是自己去网上找些公开的数据集，毕竟像ImageNet比赛或者无人驾驶这么火，公开的数据集很多的。

这里给出几个车辆检测相关数据集链接：

http://www.gti.ssr.upm.es/data/Vehicle_database.html

http://www.cvlibs.net/datasets/kitti/raw_data.php?type=city

正样本，即包含检测对象的图片，使用图像标记工具，网上搜一下有很多的，格式就是，图片名+目标个数+目标的矩形框定位（左上角坐标和矩形长宽）

正样本描述文件vec文件的创建。

已经把目标的情况记录了放在txt文件里，打开cmd窗口，输入createsamples.exe -info positive/info.txt -vec data/vector.vec -num 500 -w 24-h 24。当然你也可以使用.bat文件运行。这句话的-num后面的500表示正样本图片的数目，后面的-w和 -h说的是图片resize成的大小，根据实际情况修改。运行完会生成vector.vec文件，这个就是向量描述文件了。你不用打开看它的内容，其实打开也没用，因为是乱码的，需要专门的软件。后面会用到。

做好这个其实就成功了一大半了，制作正样本很麻烦的。下面看看怎么制、制作负样本。很简单，准备图片（不包含车的图像）1500张，多点也可以。

负样本的制作

然后在当前路径下在cmd窗口运行dir /b *.jpg >neg_name.txt就会生成一个neg_name.txt文件，里面包含当前路径下的所有jpg文件的文件名。

好了，正负样本制作完成，可以开始训练了。我们使用opencv自带的opencv_haartraining.exe文件（opencv安装目录的bin目录下面有该文件）进行训练。

参数看起来很多，有点复杂。不用管它，网上查一下就明白了，很多参数都有默认值。我训练时的命令为

opencv_haartraining.exe-data data/cascade -vec data/vector.vec -bg negative/neg_name.txt -npos 500-nneg 1500 -nstages 20 -mem 4000 -w 24 -h 24

意思依次为可执行文件名，训练好的xml分类器文件保存地址，正样本描述文件vec文件，负样本的文件名，正负样本的数量，nstages为训练轮数，mem为分配内存MB，图像resize的大小。

训练截图

这个训练过程非常慢，可能要十几二十个小时，看电脑配置和数据量，我当时训练了20多个小时。你可以让它一直训练直到完成，你也可以随时中断训练，然后随时开始，他会接着训练，不会从头再来。

经过漫长的等待训练完成得到xml分类器文件，然后使用opencv的接口即可进行车辆检测了，我是使用detectMultiScale这个函数检测的，就跟人脸检测一样的，然后输出矩形框。我直接贴出检测部分的源代码，其他部分都是直接使用opencv自带的。其实这个也算~~

#include<opencv2\opencv.hpp>
#include<opencv2\core\core.hpp>
#include<opencv2\highgui\\highgui.hpp>
#include <iostream>
using namespace std;
using namespace cv;

int main()
{
	string xmlPath = "car_model.xml";	//训练好的分类器xml文件
	CascadeClassifier ccf;   //创建分类器对象
	Mat img;
	if (!ccf.load(xmlPath))   //加载训练文件
	{
		cout << "不能加载指定的xml文件" << endl;
		return 0;
	}
	namedWindow("car");
	bool stop = false;
	//获取摄像头图像
	//VideoCapture cap(0);

	//获取文件夹图片序列
	string img_path = "data";//把图片放到当前目录的data文件夹下即可，文件名随便都可以
	vector<cv::String> vec_img;
	glob(img_path, vec_img);
	if (vec_img.empty())
	{
		std::cout << "there is no pictures." << endl;
		return -1;
	}
	//写入视频文件，我处理的是序列图片，所以我把检测结果写成视频文件了，便于观察
	//VideoWriter writer;
	//string video_name = "car1.avi";	
	//Mat temp = imread(vec_img[0]);
	//int frame_fps = 15;	//帧率
	//writer = VideoWriter(video_name, CV_FOURCC('X', 'V', 'I', 'D'), frame_fps, Size(temp.cols, temp.rows));
	while (!stop)
	{
		int64 start = getTickCount();
		for (int i = 0; i < vec_img.size(); ++i)
		{
			img = imread(vec_img[i]);
			//if (!cap.read(img))
			//	break;
			//cap >> img;
			vector<Rect> cars;  //创建一个容器保存检测出来的车辆
			Mat gray;
			cvtColor(img, gray, CV_BGR2GRAY); //转换成灰度图，因为harr特征从灰度图中提取
			//equalizeHist(gray, gray);  //直方图均衡行
			ccf.detectMultiScale(gray, cars, 1.1, 3, 0, Size(10, 10), Size(100, 100)); //检测车辆
			//cout << cars.size() << endl;
			for (vector<Rect>::const_iterator iter = cars.begin(); iter != cars.end(); iter++)
			{
				rectangle(img, *iter, Scalar(0, 0, 255), 2, 8); //画出矩形
			}
			imshow("car", img);
			//writer.write(img);
			if (waitKey(2) == 'q')//按q退出
			{
				stop = true;
				break;
			}
		}
		//计算运行时间
		cout << (getTickCount() - start) / getTickFrequency() << endl;
		break;
	}

	
	return 1;
}

测试效果截图：可以看到对于简单场景的测试，检测效果还不错，速度超快的，每秒几十帧，几乎都能正确检测出来，但是对于复杂点的场景检测效果就很差了。这个时候就要看深度学习的了

测试场景1：高速公路，目标较少，1700张序列图片（320*240），只需要25s左右.

这是高速公路的监控相机下的场景，从上面两幅图像可以看到，远处的车辆几乎都没有检测到，当车辆靠近相机时，就能准确检测到。

简单场景下检测效果较好，场景中的车辆几乎都能较准确的检测出来。

测试场景2：城市街道，由于光照和场景较复杂，检测效果很差，几乎不能检测出来

深度学习方法的对比，几乎都能正确检测出来，目前用的是YOLO方法进行车辆的检测，速度和精度都比较好，适合用于视频的实时检测。1700帧序列图像（320*240），用时600s左右，相当于大概1秒3帧，速度有点慢

注：由于车辆较多，我把目标的标签和概率去掉了，只保留了检测框。

从上图可以看到，总体检测车辆的效果良好，但第三幅图的时候出现了一个错误的检测，它把马路识别为train。还有第四幅图像，由于目标比较密集，检测框定位不准确

在更复杂的场景中，深度学习的方法表现出了更大的优势，由于光照的原因，场景中的目标不容易被检测，但是YOLO几乎全部准确检测出来。

关于YOLO进行目标检测的东西见本系列第二篇。有问题欢迎在评论区或者邮件交流，我也是初学者，有不对的地方还望各位不吝指正~~

参考文献

[1] ViolaP, Jones M. Rapid object detection using a boosted cascade of simplefeatures[C]// Computer Vision and Pattern Recognition, 2001. CVPR 2001.Proceedings of the 2001 IEEE Computer Society Conference on. IEEE, 2003:I-511-I-518vol.1.

[2] Lienhart R, Maydt J. An extended set of Haar-like features for rapidobject detection[C]// International Conference on Image Processing. 2002.Proceedings. IEEE, 2002:I-900-I-903 vol.1.

[3] http://blog.csdn.net/zhuangxiaobin/article/details/25476833

[4] Redmon J, Farhadi A. YOLO9000: Better, Faster, Stronger[J]. 2016.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

目标检测之一（传统算法和深度学习的源码学习）的相关文章

1.2 SingleThreadExecutor

线程池工具类给我们提供了一些常见的线程池 xff0c 这篇来谈一谈SingleThreadExecutor线程池使用方式创建方式比较简单 xff0c 直接使用工具创建就ok xff0c Executors newSingleThread
pycharm终止代码运行时报错：进程已结束,退出代码137 (interrupted by signal 9: SIGKILL)

在pycharm中调试代码 xff0c 终止时报错 xff1a 进程已结束退出代码137 interrupted by signal 9 SIGKILL 网上查找时 xff0c 遇到这个问题的一般是训练网络时的内存不足 xff0c 进程被
【多机多卡】mmsegmentation训练报错“RuntimeError: NCCL error in: /opt/pytorch/pytorch/torch/csrc/distributed/”

多机多卡训练代码 xff1a 报错信息 xff1a RuntimeError NCCL error in opt pytorch pytorch torch csrc distributed c10d ProcessGroupNCCL cp
STM32F4工程--串口--配置一个发送函数（详细版）

STM32F4工程串口配置一个发送函数 xff08 库函数 xff09 芯片 xff1a STM32F429IGT6 目录一初始化串口相关的参数二初始化串口IO口时钟等参数三函数声明四主函数 xff08 执行函数 xff
Ubuntu：NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver. 解决方法总结

在Ubuntu上运行Cuda并行计算的渲染项目 xff08 Massively Parallel Rendering of Complex Closed Form Implicit Surfaces 论文代码GUI部分源码 xff09 xf
Ubuntu16.04下基于BUCK安装onos

踩了很多坑 xff0c 其中很多错误也没整明白怎么回事 xff0c 实在搞不了就重装系统 xff0c 经过多次测试 xff0c 找到了一个合适的安装步骤安装ONNO 1 13 2 1 安装mininet 需要可以安装 xff09 此步骤安装
Ubuntu16.04安装中文输入法

转载自 xff1a https jingyan baidu com article 86f4a73e8f534637d752695e html 这是基于Fcitx框架的可以安装Google pinyin xff0c Sougou piny
基于IDEA分析ONOS源码

1 安装Java依赖 sudo apt get install software properties common y amp amp sudo add apt repository ppa webupd8team java y amp
ESP8266- 使用AT指令获取网络时间

前言 xff1a 很早就考虑过用 ESP8266 获取网络时间 xff0c 以前都是用 ESP8266 刷机智云的 Gagent 固件 xff0c 但无奈现在手头的 ESP 01 的 Flash 只有 1M xff0c 实在无法胜任经过在
使用git在项目中的一些经验

近期在使用gitLab管理项目 xff0c 在使用过程中遇到一些问题 xff0c 在此整理一下 git的基本配置在这里就不累赘了 xff0c 主要讲一下如何将项目托管到gitLab xff0c 并实现多人协作开发尤其介绍一下如何解决冲突
Ubuntu安装ROS报错 sudo: rosdep：找不到命令

安装ROS时初始化rosdep过程中 xff0c 执行到 xff1a sodu rosdep init 报错 xff1a sudo rosdep xff1a 找不到命令原因 xff1a 没有安装python rosdep这个包解决方法
C语言进阶 ~ 内存四区（栈、堆、全局、代码区）

特别声明 xff1a 该部分是根据B站大佬什么都想干好的视频学习而来目录 1 1 数据类型本质分析 1 1 1 数据类型概念 1 1 2 数据类型的本质 1 1 3 数据类型的别名 1 1 4 数据类型之 void 1 2 变量的本质分
C语言进阶 ~ 一级指针与字符串

目录 2 1 指针强化 2 2 一级指针 char 易错地方 2 2 1 对空字符串和非法字符串的判断 2 2 2 越界 2 2 3 指针的叠加会不断改变指针的方向 2 2 4 局部变量不要外传 2 2 5 函数内使用辅助变量的重要性 2
STC51从入门到精通（汇编）~~~ 第八讲：串行通信技术

目录 8 1 80C51单片机串行通信技术的特点 8 2 串行通信基本知识 8 2 1 数据通信 8 2 2 串行通信的传输方式 8 2 3 异步通信和同步通信 8 3 串行接口的组成和特性 8 3 1 串行口的结构 8 3 2 串行口控制
基于arduino的循迹小车（含有PID算法）

循迹小车一般分为两方面 xff1a 一方面是简单的闭环赛道只有直道和弯道 xff0c 另一方面是毕设类型的包括一些元素 xff1a 90度弯道十字道路 S形弯道等 1 CSDN下载 xff1a 含有PID xff1a https down
iar编译没有问题，但是烧录时不成功
基于手机蓝牙的arduino遥控小车

遥控小车是每个人童年的最爱 xff0c 不仅好奇它的奇妙 xff0c 更是喜欢它带来的刺激小编为大家带来几篇博客 xff0c 来给大家讲讲制作遥控小车的程序看大标题可知我们一共有五个方法去制作一款带有遥控功能的小车 xff0c 小编分开
从0到1教你写UCOS-III 第二部分：如何学习RTOS?

2 1 为什么要学习 RTOS xff1f 当我们进入嵌入式这个领域的时候 xff0c 往往首先接触的都是单片机编程 xff0c 单片机编程又首选 51 单片机来入门这里面说的单片机编程通常都是指裸机编程 xff0c 即不加入任何 RTO
课程设计题四：LED彩灯控制器设计

要求 xff1a 1 至少10个发光管4种花样自动变换 xff0c 循环往复 2 彩灯花样变换的快慢节拍可以手动和自动方式控制 xff0c 手动控制按钮按一次转换一次 xff1b 自动控制方式每15秒变换一次 xff0c 1分钟循环一遍 3
【论文学习】Robust Tracking against Adversarial Attacks论文学习

一知识点补充 OTB中的评价指标 xff08 1 xff09 one pass evaluation xff08 OPE xff09 这是目标追踪领域常用的评估方式 xff0c 只给第一帧ground truth没有随机性的算法只跑一遍就

随机推荐

【51单片机】STC89C52蜂鸣器实验，含c代码（4）

1 参考教程 xff1a 清翔51单片机教程 2 基本原理 xff1a 若vcc是5v xff0c p23低电平 xff0c 使得R10流过大于1mA的电流 xff0c 则CE导通 xff0c 蜂鸣器响 P23为高电频反之 3 C程序代码
windows 安装myslq5.7以及修改root密码

windows 安装myslq5 7以及修改root密码下载mysql5 7 下载地址 xff1a https downloads mysql com archives community 选择5 7 38版本安装mysql5 7 30
搭建Cas服务

环境要求 JDK 1 8CAS 5 3tomcat 9 1 cas项目下载地址 xff1a https github com apereo cas overlay template tree 5 3 2 使用idea导入cas overla
vsftpd配置chroot_list_enable、chroot_local_user、chroot_list_file说明

作用 xff1a chroot list enable chroot local user chroot list file 控制用户是否允许切换到上级目录 chroot local user 61 YESchroot local user
解决vncserver打开远程桌面后没有图标，只有一个鼠标问题

前言介绍一个VNC客户端 IIS7服务器管理工具作为VNC客户端 xff0c 它最优秀的功能就是支持一键导出或导入 xff0c 一键批量打开VNC xff0c 一键批量关闭VNC xff0c 多台VNC 自定义备注 xff0c 自定义分
Windows下通过VNC访问Linux服务器(可视化界面)

介绍一个 VNC连接工具 xff1a iis7VNC连接工具作为服务器集成管理器 xff0c 它最优秀的功能就是批量管理windows与linux系统服务器 vps 能极大的提高站长及服务器运维人员工作效率同时iis7服务器管理工具还是
Linux需要杀毒软件吗?存在安全隐患吗？

在我们的生活中除了常见的Windows系统和MAC系统之外 xff0c Linux也是非常常用 xff0c 现在很多人都想要掌握Linux技术 xff0c 加入该行列之中 xff0c 成为专业的技术人员那么Linux需要杀毒软件吗为大家
云产品的选型

云产品的选型一 xff0c 云平台的基本组件一 xff0c 云平台的基本组件 1 ECS xff08 云服务器云主机 xff09 2 RDS xff08 关系型数据库 xff09 3 SLB xff08 负载均衡 xff09 4 OS
SSH无法登陆服务器，但是可以ping通，解决方法

SSH无法登陆服务器 xff0c 但是可以ping通 xff0c 解决方法参考文章 xff1a xff08 1 xff09 SSH无法登陆服务器 xff0c 但是可以ping通 xff0c 解决方法 xff08 2 xff09 https
[树莓派]wifi在面板看不到，但是可以scan到的解决方案

树莓派 wifi在面板看不到 xff0c 但是可以scan到的解决方案参考文章 xff1a xff08 1 xff09 树莓派 wifi在面板看不到 xff0c 但是可以scan到的解决方案 xff08 2 xff09 https www
神策S据笔试 2020-9-1：ipv7转10进制，笔试结束完10分钟通了呜呜呜！不能用Math.pow()

题目 xff1a ipv7 转 10进制输出 xff0c 不能调特殊的ip转换库函数 xff1a span class token number 1 0 span span class token number 0 span span cl
SKlearn里面的K-means使用详解

在K Means聚类算法原理中 xff0c 我们对K Means的原理做了总结 xff0c 本文我们就来讨论用scikit learn来学习K Means聚类重点讲述如何选择合适的k值 1 K Means类概述在scikit learn
python中的列表、数组以及张量数据类型之间的相互转换

定义一个列表数据L xff0c 可以理解为其中包含两个元素 xff0c 每个元素是一个5维的向量 import torch import numpy L 61 1 2 3 4 5 2 3 4 5 6 a 61 torch Tensor L
YOLO-V1至YOLO-V4学习笔记

YOLO学习笔记 YOLO学习笔记一 YOLO V1二 YOLO V2 xff1a 三 YOLO V3 xff1a 四 YOLO V4 xff1a YOLO学习笔记一 YOLO V1 针对对FasterR CNN改进 xff0c 取消了区
【记录+解决】ubuntu服务器显卡驱动安装；Ubuntu20.04重启后找不到Nvidia显卡驱动

记录ubuntu服务器显卡驱动安装一次ubuntu服务器显卡驱动安装历程 xff0c 简单记录 1 下载Nvidia Linux驱动到本地 Nvidia Linux XXX run 2 停用桌面 xff0c 安装驱动 span class
【解决】ubuntu桌面无法进入问题

ubuntu桌面崩溃 xff0c 无法进入记录一次ubuntu桌面崩溃无法进入系统桌面问题的解决 xff0c 无法进入桌面 xff0c 但可以进入终端的情况下可以参考解决 span class token comment 进入终端 spa
jetson tx2安装opencv

Jstson TX2 安装opencv 参考 xff1a https blog csdn net QLULIBIN article details 84072356 版本 xff1a Jetson TX2JetPack3 2OpenCV3
C++符号修饰Name-mangling

C 43 43 符号修饰 C语言符号修饰在上古时期 xff0c 编译器编译源代码产生目标文件时 xff0c 符号名与相应的变量和函数的名字是一样的比如一个汇编源代码里面包含一个函数foo xff0c 那么汇编器将其编译成目标文件后 xf
VS Code远程SSH免密登录配置

最近更新了VS Code之后 xff0c 发现Remote ssh拓展里的端口转发功能没了 xff0c 很伤心 xff0c 在探索的同时 xff0c 顺手配置了一下VS Code ssh免密登录 xff0c 以省去每次连接远程文件夹时输入两
目标检测之一（传统算法和深度学习的源码学习）

目标检测之一 xff08 传统算法和深度学习的源码学习 xff09 本系列写一写关于目标检测的东西 xff0c 包括传统算法和深度学习的方法都会涉及到 xff0c 注重实验而不着重理论 xff0c 理论相关的看论文去哈 xff0c 主要依赖

目标检测之一（传统算法和深度学习的源码学习）

目标检测之一（传统算法和深度学习的源码学习） 的相关文章

随机推荐

热门标签

目标检测之一（传统算法和深度学习的源码学习）的相关文章