yolov2检测网数据集获取与预处理_采集健康和非健康猫狗数据

2023-11-10

yolov2检测网数据集获取与预处理_采集健康和非健康猫狗数据

一、网上公开数据集
二、获取并预处理数据集
相关链接

一、网上公开数据集

二、获取并预处理数据集

2.1 获取非健康的猫狗数据

因为开源数据库中没有非健康猫狗相关的，所以需要自己下载非健康猫狗数据，并制作数据集。
下面是用于爬取非健康猫狗数据的爬虫代码：

# 爬取代码1，可以输入关键词进行爬取百度图库图片，但是运行报错了
import requests
import os
import re
#设置请求头，防止被百度禁止访问
headers={
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'
}
#word是要爬的图片名字
word=input("请输入关键词：")
#j用来标记图片数量
j=1
class PaChong:
    def __init__(self,word,i):
        #path是图片存放的地方
        self.path="C://Users/tanhui/Desktop/比赛项目文档/3_数据集制作和标注//"+word+"/"
#         第几页
        self.page=i/20+1
        #如果文件夹不存在，则创建文件夹
        if not os.path.exists(self.path):
            os.mkdir(self.path)
    #发出requests请求
    def requests_get(self,url):
        requests.adapters.DEFAULT_RETRIES = 5
        req=requests.get(url,timeout=30)
        req.encoding="utf-8"
        self.req=req.text
    
    #正则找到图片链接
    def  get_imgurl(self):
        imgurls=re.findall('"objURL":"(.*?)"',self.req,re.S)
        self.imgurls=imgurls
    #下载图片到本地
    def download(self):
        global j
        for imgurl in self.imgurls:
            path=self.path+word+str(j)
            #写入文件
            with open(path+".jpg","wb") as f:
                r=requests.get(imgurl)
                f.write(r.content)
            print("%s下载成功"%path)
            j+=1
        print("第{}页下载结束！".format(self.page))
#通过pn参数实现翻页，第一页为0，,间隔为20
for i in range(0,60,20):
    url="https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word={0}&pn={1}&gsm=50&ct=&ic=0&lm=-1&width=0&height=0".format(word,i)
    Run=PaChong(word,i)
    Run.requests_get(url)
    Run.get_imgurl()
    Run.download()

'''
爬取指定关键字图片,这个反爬取效果好
'''
import re# 正则表达式，解析网页
import requests# 请求网页
import traceback
import os
    
def dowmloadPic(html,keyword,startNum):
    headers = {'user-agent':'Mozilla/5.0'}# 浏览器伪装，因为有的网站会反爬虫，通过该headers可以伪装成浏览器访问，否则user-agent中的代理信息为python
    pic_url = re.findall('"objURL":"(.*?)",',html,re.S)# 找到符合正则规则的目标网站
    num = len(pic_url)
    i = startNum
    subroot = root + '/' + word
    txtpath = subroot + '/download_detail.txt'

    print('找到关键词:'+keyword+'的图片，现在开始下载图片...')
    
    for each in pic_url:
        a = '第'+str(i+1)+'张图片，图片地址:'+str(each) + '\n'
        b = '正在下载' + a
        print(b)
        path = subroot + '/' + str(i+1)
        try:
            if not os.path.exists(subroot):
                os.mkdir(subroot)
            if not os.path.exists(path):
                pic = requests.get(each,headers = headers,timeout = 10)
                with open(path+'.jpg','wb') as f:
                    f.write(pic.content)
                    f.close()
                with open(txtpath,'a') as f:
                    f.write(a)
                    f.close()
                    
        except:
            traceback.print_exc()
            print ('【错误】当前图片无法下载')
            continue
        i += 1
 
    return i
 
 
if __name__ == '__main__':
    
    headers = {'user-agent':'Mozilla/5.0'}
    words = ['病猫','病狗']
    #words为一个列表，可以自动保存多个关键字的图片
    root = './download_images_of_'
    for word in words:
        root = root + word + '&'
    if not os.path.exists(root):
        os.mkdir(root)
    for word in words:
        lastNum = 0
        # word = input("Input key word: ")
        if word.strip() == "exit":
            break
        pageId = 0
        #此处的参数为需爬取的页数，设置为20页
        for i in range(20):
            url = 'http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=' + word + "&pn="+str(pageId)+"&gsm=?&ct=&ic=0&lm=-1&width=0&height=0"
            pageId += 20#好像没啥影响
            html = requests.get(url,headers = headers)
            # print(html.text) #打印网页源码，相当于在网页中右键查看源码内容
            lastNum = dowmloadPic(html.text, word, lastNum,)#本条语句执行一次获取60张图

2.2 剔除重复的猫狗数据

使用图片去重／相似图片清理利器软件清除重复的图片数据。

2.3 淘宝购买猫狗救助视频

使用ffmpeg将救助视频文件按照一秒截取一张PNG图片，ffmpeg相关链接可以参考5.3.2.3节

ffmpeg -i xxx.mp4 -r 1 -y C:\Users\tanhui\Desktop\比赛项目文档\3_数据集制作和标注\4_unhealthy_dogs\xxx_%6d.png

2.4 批量重命名猫狗

按照如下命名：

1_healthy_cats/healthy_cat_1.jpg
2_unhealthy_cats/unhealthy_cat_1.jpg
3_healthy_dogs/healthy_dog_1.jpg
4_unhealthy_dogs/unhealthy_dog_1.jpg

批量重命名程序1：

# -*- coding: utf-8 -*-
import os
#对所有文件以数字递增的方式重命名
def file_rename():
    i = 0
    #需要重命名的文件绝对路径
    path = r"C:\Users\tanhui\Desktop\比赛项目文档\3_数据集制作和标注\4_unhealthy_dogs"
     #读取该文件夹下所有的文件
    filelist = os.listdir(path)  
    #遍历所有文件
    for files in filelist:   
        i = i + 1
        Olddir = os.path.join(path, files)    #原来的文件路径
        if os.path.isdir(Olddir):       #如果是文件夹则跳过
                continue
        #os.path.splitext(path)  #分割路径，返回路径名和文件扩展名的元组
        #文件名，此处没用到
        filename = os.path.splitext(files)[0]     
        #文件扩展名
        filetype = os.path.splitext(files)[1]         #如果你不想改变文件类型的话，使用原始扩展名
        Newdir = os.path.join(path, str(i)+filetype)   #新的文件路径
        os.rename(Olddir, Newdir)   
    return True

if __name__ == '__main__':
    file_rename()

批量重命名程序2：

import os

def rename():
    i = 0
    path = r"C:\Users\tanhui\Desktop\比赛项目文档\3_数据集制作和标注\4_unhealthy_dogs"

    filelist = os.listdir(path)   #该文件夹下所有的文件（包括文件夹）
    for files in filelist:   #遍历所有文件
        i = i + 1
        Olddir = os.path.join(path, files)    #原来的文件路径
        if os.path.isdir(Olddir):       #如果是文件夹则跳过
                continue
        filename = '4_unhealthy_dog_'     #文件名
        filetype = '.jpg'        #文件扩展名
        Newdir = os.path.join(path, filename + str(i) + filetype)   #新的文件路径
        os.rename(Olddir, Newdir)    #重命名
    return True

if __name__ == '__main__':
    rename()

2.5 图像数据下采样

使用ffmpeg截取视频帧获得的图像大小为1080P的，虽然使用Yolov2网络训练时，输入的图像是任意大小的（参考5、6），但过高码率的图像会在训练时出现显存不足或者训练速度较慢的情况。因此将进行图像进行下采样处理。在单独使用cv2.resize函数进行调整图片会出现图片文件还是几百kb的情况，所以我们需要用cv的jpeg进行压缩，这里的压缩比设置为50，能够得到10-40kb的图像。

import cv2
import os
import time
# 图像处理函数
def resize_image(lr_path,sr_path):
   
    #读入图片
    img_lr = cv2.imread(lr_path,1)

    #获取图像尺寸
    height, width = img_lr.shape[:2]

    #判断图像等于1080p
    if height == 1080 and width == 1920:
        #图像缩放到原来的1/4
        img_sr = cv2.resize(img_lr,(1920//4,1080//4),interpolation=cv2.INTER_CUBIC)
        #保存图像
        #对于jpg文件的压缩，第三个参数是压缩质量
        #1M 100K 10K 图片质量的范围是0-100 有损压缩
        #jpg图片的额压缩压缩质量参数数值越小，压缩比越高
        cv2.imwrite(sr_path,img_sr,[cv2.IMWRITE_JPEG_QUALITY,50]) # 保存图片的质量，值为0到100，越高质量越好，默认95
        print(sr_path + ' resize success')
    #图像不等于1080p
    else:
        print(lr_path + ' is not 1080p')
        cv2.imwrite(sr_path,img_lr) 

if __name__ == "__main__":
    print("处理图片中...\n")
    start = time.time()
    # 遍历原始目录，对每个低分辨率图片进行处理，并保存到对应文件夹中
    for root, dirs, files in os.walk("2_unhealthy_cats"):
        for file in files:
            # 构造低分辨率图片路径
            lr_path = os.path.join(root, file)
            # 构造处理后图片保存路径
            sr_path = lr_path.replace("2_unhealthy_cats", "2_unhealthy_cats_resize")
            # 创建保存目录
            os.makedirs(os.path.dirname(sr_path), exist_ok=True)

            # 进行图片处理并保存
            resize_image(lr_path, sr_path)
    end = time.time()
    print("处理完成，耗时：{:.2f}s".format(end - start))

YOLO

yolov2检测网数据集获取与预处理_采集健康和非健康猫狗数据的相关文章

【目标检测】yolov5模型详解

文章目录一 Yolov5网络结构 1 1 Input 1 2 Backbone 1 2 1 Conv模块 1 2 2 C3模块 1 2 3 SPPF模块 1 3 Neck 1 4 Head 1 4 1 head 1 4 2 目标框回归 1
图像识别-YOLO V8安装部署-window-CPU-Pycharm

前言安装过程中发现 YOLO V8一直在更新现在是2023 9 20的版本已经和1月份刚发布的不一样了 eg 目录已经变了旧版预测在ultralytics yolo v8 下detect 新版 ultralytics models
DeepLearing—CV系列（十）——多类多目标物体的侦测——YOLO系列之YOLOv2、YOLO9000算法详解

文章目录前言一 YOLOv2的优化改进Better 预测更准确 1 1 Batch Normalization 批归一化 1 2 High Resolution Classifier 大尺度预训练分类 1 3 Convolutional
官方YOLOV5的torch模型-＞ONNX模型-＞RKNN模型

1 环境配置 1 1 RKNN Toolkit2的环境配置下载RKNN Toolkit2 git clone https github com rockchip linux rknn toolkit2 git 打开一个终端命令行窗口安装
YOLO物体检测-系列教程2：YOLOV2整体解读

YOLO 系列教程总目录 YOLOV1整体解读 YOLOV2整体解读 YOLOV2提出论文 YOLO9000 Better Faster Stronger 1 YOLOV1 优点快速简单问题1 每个Cell只预测一个类别如果重叠无
YOLOV5代码general.py文件解读

YOLOV5源码的下载 git clone https github com ultralytics yolov5 git YOLOV5代码general py文件解读 import glob import logging import o
YOLOv5 backbone（一）

Backbone概览及参数 Parameters nc 80 number of classes depth multiple 0 33 model depth multiple width multiple 0 50 layer chan
利用Albumentations工具包进行图像的数据增强（以yolo数据标注格式为例）

最近在看数据增强方法时看到了这个有趣的工具包研究了下并以yolo数据标注格式为例写了一个示例脚本该工具最大的好处是会根据你使用的数据增强方法自动修改标注框信息 import albumentations as A import cv2
【使用TensorRT自带的plugin】

0 背景在之前的文章TensorRT的plugin实现中介绍了如何从零实现一个TensorRT的plugin 这篇文章来介绍如何使用TensorRT自带的plugin 将其添加到Network Definition中加速我们的模型自T
[YOLO专题-26]：YOLO V5 - ultralytics代码解析-detect.py程序的流程图与对应的plantUML源码

作者主页文火冰糖的硅基工坊文火冰糖王文兵的博客文火冰糖的硅基工坊 CSDN博客本文网址 https blog csdn net HiWangWenBing article details 122443972 目录第1章 det
YOLO终结者？百度最新RT-DETR：114FPS实现54.8AP，远超YOLOv8！

作者 Kissrabbit 编辑汽车人原文链接 https zhuanlan zhihu com p 626659049 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心目标检测技术交流群
一文搞定attntion机制在CNN中的应用，手把手教你在Yolov5中插入attention. Attention结构的创新方法

免责声明 1 此方法仅提供参考 2 搬了其他博主的操作方法以贴上路径 3 场景一什么是Attention 场景二 Attention在cnn上的作用场景三常见的Attention机制场景四 Attention机制的创新思路场景五
YOLO3 -- 介绍

YOLO介绍 YOLO官网 YOLO You Only Look Once 是目标检测模型目标检测是计算机视觉中比较简单的任务用来在一张图片中找到某些特定的物体目标检测不仅要求我们识别这些物体的种类同时要求我们标出这些物体的位置 Y
YOLOV5-6.1报错：OSError: [WinError 1455] 页面文件太小，无法完成操作。

YOLOV5 6 1报错 OSError WinError 1455 页面文件太小无法完成操作注意成功解决方案注意数据集和之前的共用一个数据集使用之前的处理方式
如何减少 YOLOv3 文件中的类数量？

我正在使用 YOLOv3 来检测视频中的汽车我下载了代码中使用的三个文件coco names yolov3 cfg and yolov3 weights它们针对 80 种不同类别的待检测物体进行了训练该代码可以运行但速度非常慢每帧需
yolo网络整理-网络结构原理与anchor

YOLOv5 是Glenn Jocher等人操刀研发 Ultralytics公司的开源项目项目地址可点击 2020年6月发布以来 Ultralytics公司一直在对项目进行维护与更新目前repo的star数目突破44k YOLOv5的功
在 Google Colab 中使用笔记本电脑网络摄像头进行实时 YOLO 对象检测

我正在使用网络摄像头在本地系统上使用 YOLOv3 和 OpenCV 进行实时对象检测一切都像魅力一样运作链接在这里 https github com pdhruv93 YOLO Object Detection blob master
yolov5无人机视频检测与计数系统（创新点和代码）

标题基于YOLOv5的无人机视频检测与计数系统摘要无人机技术的快速发展和广泛应用给社会带来了巨大的便利但也带来了一系列的安全隐患为了实现对无人机的有效管理和监控本文提出了一种基于YOLOv5的无人机视频检测与计数系统该系统通过
无法解析 netParameter 文件

gt py yolo py video path F Data Science Python37 Scripts YOLO videos lowres mp4 Traceback most recent call last File yol
执行多尺度训练（yolov2）

我想知道多尺度训练如何YOLOv2 https arxiv org pdf 1612 08242 pdf works 论文中指出原始YOLO使用的输入分辨率为448 448 通过添加锚框我们将分辨率更改为416 416 然而由于我们的

随机推荐

gin-巧用Context传递多种参数

目录引言 1 巧妙包装gin Context为NewContext 2 在使用gin Use对每一个请求的Context进行组装 3 在路由绑定时解析出NewContext来为应用层函数提供参数并且调用应用层函数 4 总结引言首先给
wget

参考 http apple stackexchange com questions 100570 getting files all at once from a web page using curl 一份份的下载文件有点麻烦所以 wg
数据结构之图:邻接矩阵和邻接表、深度优先遍历和广度优先遍历

简介线性表是一种线性结构除了头结点和尾节点线性表的每个元素都只有一个前取节点和一个后继节点而树结构则相较于线性表更加复杂它描述的关系为数据元素之间的父子关系也是现实世界父子关系的缩影一个父亲节点可以有零个或者多个子节点而每个
解决tensorflow没有compat的问题

经过我多年的产bug经验判断一般这种情况出现在anaconda下载的tensorflow2 x版本中如果知道自己的tensorflow环境地址的话可以进去检查一下当前版本的tensorflow缺以下哪几个包不知道也没关系直接无脑下载
机器学习-GBDT

GBDT gbdt是一种以CART树通常为基分类器的boosting算法大家可以仔细查一下boosting的介绍这里不再赘述 gbdt通过多轮迭代每轮迭代产生一个弱分类器每个分类器在上一轮分类器的残差基础上进行训练对弱分类器的
@apinote_新的Javadoc标签@ apiNote，@ implSpec和@implNote

apinote 如果您已经在使用Java 8 则可能会看到一些新的Javadoc标签 apiNote implSpec和 implNote 他们怎么了如果要使用它们该怎么办总览该帖子将快速查看标签的来源和当前状态然后它将解释它们
R语言中基本图形的绘制

条形图简单的垂直条形图和水平条形图函数barplot gt library vcd 载入需要的程辑包 grid gt counts lt table Arthritis Improved gt counts None Some Mark
matlab插值：拉格朗日插值

拉格朗日插值即对所要插值的函数进行拉格朗日多项式拟合这是matlab插值系列的第二期第一期数值分析拟合 Matlab三次样条插值拟合数据以后会有时间的时候再更新更多的插值方法这篇文章我推导过程参考过了一些其他文章代码是自己写的
HTML5滑动(swipe)事件,移动端触摸（touch）事件

目有个交互需要实现手指滑动的交互 pc端使用mousedown mousemove mouseup监听实现但在ios设备上mousemove是不好监听的同类的方法是touchstart touchmove touchend 项目需求需
快速搞懂无偏估计及样本方差中的n-1

期望EX 方差DX 我们知道任一样本和总体是同分布的所以任一样本的期望即总体期望均值任一样本的方差即总体方差所以对于任一样本X 有 E X E
移动支付行业发展和商业模式迭代孕育新商机

在短短十几年的时间当中 PC互联网移动互联网以及风头正盛的物联网所引发的三次技术浪潮彻底颠覆了人们沿袭数千年的交易支付模式也让交易介质从实物货币到数字流转再到如今更为便捷和安全的刷脸支付这便是科技改变社会成为第一生产力的缩影
QTabWidget移除部分分页的方法

1 将各分页保存起来 QList
Hands-On Hyperledger Fabric——Byzantine-fault tolerant(BFT)过程详解

文章目录拜占庭问题描述分布式架构遭遇的问题 Practical Byzantine Fault Tolerance PBFT PBFT过程详解拜占庭问题描述拜占庭将军问题是分布式计算中的一个经典问题拜占庭将军问题是Leslie L
http协议各个版本

一 HTTP协议版本更替 http 0 9 1991 原型版本功能简陋只有一个命令GET GET index html 服务器只能回应HTML格式字符串不能回应别的格式 http 1 0 每个TCP连接只能发送一个请求发送数据完毕
osgEarth的Rex引擎原理分析（六）earth文件如何解析成Config

目标解决一中的问题构建地图节点的依据是Config osgEarthDrivers earth EarthFileSerialize2 cpp osg Node EarthFileSerializer2 deserialize co
13. 实战：XPath法抓取某网站外包信息

目录前言思路代码实现第一步先获取页面源代码第二步交给XPath的HTML解释器进行解析第三步通过源代码检查并获取XPath路径第四步创建csv文件准备写入数据第五步遍历所有的div 获取我们需要的信息完整代码
linux：ubuntu mysql 、redis和Mongodb安装

1 安装mysql sudo apt update sudo apt install mysql server 验证MySQL服务器正在运行 sudo systemctl status mysql 保护MySQL 安装随附一个名为的脚本my
基于KOS系统超详细Aircrack-ng安装保姆级教程

目录 1 概述 2 安装准备 2 1 操作系统环境 2 2 软件版本 3 安装运行 3 1 安装编译环境 3 2 获取Aircrack ng源码包 3 3 编译Aircrack ng 3 4 运行Aircrack ng 1 概述浪潮信息K
一些时序计算题

最近在持续笔试中今天见的题感觉难度又上升了因此需要计算一下首先来看一下题目已知输入延时 T in delay 1ns Inverter的延时 T inv max 1ns T inv min 0 5ns Buffer的延时 T bu
yolov2检测网数据集获取与预处理_采集健康和非健康猫狗数据

yolov2检测网数据集获取与预处理采集健康和非健康猫狗数据一网上公开数据集二获取并预处理数据集 2 1 获取非健康的猫狗数据 2 2 剔除重复的猫狗数据 2 3 淘宝购买猫狗救助视频 2 4 批量重命名猫狗 2 5 图像数据下采

yolov2检测网数据集获取与预处理_采集健康和非健康猫狗数据

yolov2检测网数据集获取与预处理_采集健康和非健康猫狗数据

一、网上公开数据集

二、获取并预处理数据集

2.1 获取非健康的猫狗数据

2.2 剔除重复的猫狗数据

2.3 淘宝购买猫狗救助视频

2.4 批量重命名猫狗

2.5 图像数据下采样

相关链接

yolov2检测网数据集获取与预处理_采集健康和非健康猫狗数据 的相关文章

随机推荐

热门标签

yolov2检测网数据集获取与预处理_采集健康和非健康猫狗数据的相关文章