图像识别流程学习总结

2023-10-31

通过图像识别的学习，初步总结了图像识别的流程及归类，希望可以帮到正在学习的小伙伴。
在这里插入图片描述
一、前期准备工作
1、数据集的获取
在进行数据分析之前需要有数据进行识别，这里所谓的数据指的是图像，我们需要对需要识别的图像分好其类别才能更好的调用。下面以天气数据集为例，共分为四类，数据集划分如下图所示：

['cloudy', 'rain', 'shine', 'sunrise']

在这里插入图片描述
2、获取数据集路径
获取数据集的方法有很多，这里使用的是pathlib函数库，也可以使用os函数库获取数据

import pathlib
data_dir = "G:\BaiduNetdiskDownload\climate\weather_photos/"
data_dir = pathlib.Path(data_dir)
#查看数据数量
image_count = len(list(data_dir.glob('*/*.jpg')))

3、数据集划分
这里函数validation_split将数据集划分为0.8:0.2即4:1

#训练集
train_ds = tf.keras.preprocessing.image_dataset_from_directory(
    data_dir,
    validation_split=0.2,
    subset="training",
    seed=123,
    image_size=(img_height, img_width),
    batch_size=batch_size)
#验证集
val_ds = tf.keras.preprocessing.image_dataset_from_directory(
    data_dir,
    validation_split=0.2,
    subset="validation",
    seed=123,
    image_size=(img_height, img_width),
    batch_size=batch_size)

4、数据预处理

shuffle():打乱数据，关于此函数的详细介绍可以参考: https:lzhuanlan.zhihu.com/p/42417456
prefetch():预取数据，加速运行
在这里插入图片描述

AUTOTUNE = tf.data.AUTOTUNE
train_ds = train_ds.cache().shuffle(1000).prefetch(buffer_size=AUTOTUNE)
val_ds = val_ds.cache().prefetch(buffer_size=AUTOTUNE)
num_classes = 4
batch_size = 32
img_height = 180
img_width = 180

二、网络模型构建
1、模型搭建
卷积神经网络的基本组成包括输入层、卷积层、激活函数、池化层、全连接层（放在最后作为输出层）等组成。各层的主要功能这里不在详细介绍，可以参考连接
直接上代码：

model = models.Sequential([
    layers.experimental.preprocessing.Rescaling(1. / 255, input_shape=(img_height, img_width, 3)),

    layers.Conv2D(16, (3, 3), activation='relu', input_shape=(img_height, img_width, 3)),  # 卷积层1，卷积核3*3
    layers.AveragePooling2D((2, 2)),  # 池化层1，2*2采样
    layers.Conv2D(32, (3, 3), activation='relu'),  # 卷积层2，卷积核3*3
    layers.AveragePooling2D((2, 2)),  # 池化层2，2*2采样
    layers.Conv2D(64, (3, 3), activation='relu'),  # 卷积层3，卷积核3*3
    layers.Dropout(0.3),

    layers.Flatten(),  # Flatten层，连接卷积层与全连接层
    layers.Dense(128, activation='relu'),  # 全连接层，特征进一步提取
    layers.Dense(num_classes)  # 输出层，输出预期结果
])

model.summary()  # 打印网络结构

其网络详细参数可通过**model.summary()**打印出
在这里插入图片描述
2、网络配置
包括优化器的选取、算是函数的选取、学习率的设计

# 编译 设置优化器
#learning_rate=0.001学习率
opt = tf.keras.optimizers.Adam(learning_rate=0.001)

model.compile(optimizer=opt,
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

三、模型评价
1、训练+验证

epochs = 50#训练次数

history = model.fit(
  train_ds,
  validation_data=val_ds,
  epochs=epochs
)

训练过程可视化代码

acc = history.history['accuracy']
val_acc = history.history['val_accuracy']

loss = history.history['loss']
val_loss = history.history['val_loss']

epochs_range = range(epochs)

plt.figure(figsize=(12, 4))
plt.subplot(1, 2, 1)
plt.plot(epochs_range, acc, label='Training Accuracy')
plt.plot(epochs_range, val_acc, label='Validation Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Validation Accuracy')

plt.subplot(1, 2, 2)
plt.plot(epochs_range, loss, label='Training Loss')
plt.plot(epochs_range, val_loss, label='Validation Loss')
plt.legend(loc='upper right')
plt.title('Training and Validation Loss')
plt.show()

训练过程如下图
在这里插入图片描述
2、评价
将训练的模型进行保存，用于评价预测结果时调用

model.save('./checkpoint/model.h5')
#评价结果
score = model.evaluate_generator(Generator(testpath,batch_size),steps=int(m) // batch_size)

评价公式如下

def Precision(y_true, y_pred):
    """精确率"""
    tp = K.sum(K.round(K.clip(y_true * y_pred, 0, 1)))  # true positives
    pp = K.sum(K.round(K.clip(y_pred, 0, 1)))  # predicted positives
    precision = tp / (pp + K.epsilon())
    return precision

def Recall(y_true, y_pred):
    """召回率"""
    tp = K.sum(K.round(K.clip(y_true * y_pred, 0, 1)))  # true positives
    pp = K.sum(K.round(K.clip(y_true, 0, 1)))  # possible positives
    recall = tp / (pp + K.epsilon())
    return recall


def F1(y_true, y_pred):
    """F1-score"""
    precision = Precision(y_true, y_pred)
    recall = Recall(y_true, y_pred)
    f1 = 2 * ((precision * recall) / (precision + recall + K.epsilon()))
    return f1

如何使用，请参考链接

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

学习

深度学习

python

图像识别流程学习总结的相关文章

在 Python 中解析 TCL 列表

我需要在双括号上拆分以空格分隔的 TCL 列表例如 OUTPUT 172 25 50 10 01 01 Ethernet 172 25 50 10 01 02 Ethernet Traffic Item 1 172 25 50 10 01
Python - 比较同一字典中的值

我有一本字典 d Trump MAGA FollowTheMoney Clinton dems Clinton Stein FollowTheMoney Atlanta 我想删除字符串列表中的重复字符串该字符串是键的值对于这个例子期望
计算另一个字符串中多个字符串的出现次数

在 Python 2 7 中给定以下字符串 Spot是一只棕色的狗斑点有棕色的头发斑点的头发是棕色的查找字符串中 Spot brown 和 hair 总数的最佳方法是什么在示例中它将返回 8 我正在寻找类似的东西string c
如何在 Matplotlib 饼图周围绘制箭头以将每个标签指向圆圈中各自的部分？

我一直在用 Matplotlib 绘制一些图表我有一个饼图想要在图表周围绘制箭头使每个标签都指向图表我有一个例子这是我当前的代码 import matplotlib pyplot as plt plt rcParams font
在 Python 中将列表元素作为单独的项目返回

Stackoverflow 的朋友们大家好我有一个计算列表的函数我想单独返回列表的每个元素如下所示接收此返回的函数旨在处理未定义数量的参数 def foo my list 1 2 3 4 return 1 2 3 4 列表中的元素数
VSCode Settings.json 丢失

我正在遵循教程并尝试将 vscode 指向我为 Scrapy 设置的虚拟工作区但是当我在 VSCode 中打开设置时工作区设置选项卡不在用户设置选项卡旁边我还尝试通过以下方式手动转到文件 APPDATA Code User s
Django Rest Framework 是否有第三方应用程序来自动生成 swagger.yaml 文件？

我有大量的 API 端点编写在django rest framework并且不断增加和更新如何创建和维护最新的 API 文档我当前的版本是 Create swagger yaml文件并以某种方式在每次端点更改时自动生成然后使用此文件作
如何从Python中的函数返回多个值？ [复制]

这个问题在这里已经有答案了如何从Python中的函数返回多个变量您可以用逗号分隔要返回的值 def get name you code return first name last name 逗号表示它是一个元组因此您可以用括号将值括
使用主题交换运行多个 Celery 任务

我正在用 Celery 替换一些自制代码但很难复制当前的行为我期望的行为如下创建新用户时应向tasks与交换user created路由键该消息应该触发两个 Celery 任务即send user activate email
在 Django Admin 中调整字段大小

在管理上添加或编辑条目时 Django 倾向于填充水平空间但在某些情况下当编辑 8 个字符宽的日期字段或 6 或 8 个字符的 CharField 时这确实是一种空间浪费字符宽然后编辑框最多可容纳 15 或 20 个字符我如何告
Pycharm 在 os.path 连接上出现“未解析的引用”

将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
MongoEngine 查询具有以列表中指定的前缀开头的属性的对象的列表

我需要在 Mongo 数据库中查询具有以列表中任何前缀开头的特定属性的元素现在我有一段这样的代码 query mymodel terms term in query terms 并且这会匹配在列表 term 上有一个项目的对象该列表中的
打印包含字符串和其他 2 个变量的变量

var a 8 var b 3 var c hello my name is var a and var b bye print var c 当我运行程序时 var c 会像这样打印出来 hello my name is 8 and 3 b
导入错误：没有名为flask.ext.login的模块

我的flask login 模块有问题我已经成功安装了flask login模块另外从命令提示符我可以轻松运行此脚本不会出现错误 Python 2 7 r27 82525 Jul 4 2010 07 43 08 MSC v 1500
未知错误：Chrome 无法启动：异常退出

当我使用 chromedriver 对 Selenium 运行测试时出现此错误 selenium common exceptions WebDriverException Message unknown error Chrome fail
python的shutil.move()在linux上是原子的吗？

我想知道python的shutil move在linux上是否是原子的如果源文件和目标文件位于两个不同的分区上行为是否不同或者与它们存在于同一分区上时的行为相同吗我更关心的是如果源文件和目标文件位于同一分区上 shutil move
尽管我已在 python ctypes 中设置了信号处理程序，但并未调用它

我尝试过使用 sigaction 和 ctypes 设置信号处理程序我知道它可以与python中的信号模块一起使用但我想尝试学习当我向该进程发送 SIGTERM 时但它没有调用我设置的处理程序只打印终止为什么它不调用处理程序
Python：Goslate 翻译请求返回“503：服务不可用”[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我们不允许提出寻求书籍工具软件库等推荐的问题您可以编辑问题以便用事实和引文来回答这个问题似乎不是关于主要由程序员使用的特定编程问
制作一份 Python 文档的 PDF 文件

Python 官方网站提供 PDF 文档下载但它们是按章节分隔的我下载了源代码并构建了 PDF 文档这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件我认为这样阅读起来会更方便如果连接单独
如何使用 Boto3 启动具有 IAM 角色的 EC2 实例？

我无法弄清楚如何使用指定的 IAM 角色在 Boto3 中启动 EC2 实例以下是迄今为止我如何成功创建实例的一些示例代码 import boto3 ec2 boto3 resource ec2 region name us west 2

随机推荐

validform表单验证插件最终版

做个笔记以后直接用吧报名界面
C++类上使用属性(__declspec property)

原始代码如下 class A private int m nIndex public int getIndex return m nIndex void setIndex int value m nIndex value 如果采用属性方式实
JSP页面forEach使用

1 在jsp页面引入jstl标签 2 后端传入前端list ServletActionContext getRequest setAttribute List别名 detailList 3 前端jsp接收 table tr th 列名称A
开发实例系列：一、舒尔特方格小游戏，付源码和APK

舒尔特方格生成随机数从小到大依次点击时间越短越好底部带源码和apk下载注意功能点一使用TableLayout自动生成表格这一部分是参考网上的帖子找不到原连接了自定义TableLayout 以下是源码 public cla
Rocket学习原理以及命令【详细】

运行原理图 NameServer 相当于一个注册中心把所有信息注册到其中 Broker 存储消息的 Producer 消息生产者 Consumer 消费者总结首先启动NameServer 然后启动Borker把ip地址等信息注册到Na
腾讯云服务器+ContOS 7.6安装MySql(三)

腾讯云服务器 ContOS 7 6安装MySql 三配置mysql 首先来看下我们安装了MySQL以后还剩多少磁盘空间登录腾讯云控制台实例资源使用情况系统盘大概用来3 3G左右磁盘刚开始好像是2 9多G 再把下载好的安装包删
正则表达式之字符串的replace方法

1 首先正则表达式是什么正则表达式是用于匹配字符串中字符组合的模式在 JavaScript中正则表达式是对象这些模式被用于 RegExp 的 exec 和 test 方法以及 String 的 match matchAll re
老年人教程：MyBatis拦截器动态修改SQL(更新与插入)语句

注本文编写与 2019年12月17日内容可能存在时效性问题数据库使用MySQL5 7 集成于SpringBoot 2 0 X 引用国产的开源工具类Hutool 本教程建议显示大纲视图配合食用一简介 1 设定使用场景任意 ins
nginx、uWSGI、django之间的具体联系

前言看了网上很多的nginx uWSGI django服务器框架搭建配置过程但是绝大多数都只是说说搭建过程并没有说过之间具体的联系三者之间的区别与联系 uwsgi wsgi和nginx的区别和关系参考博文写的特别棒浅显易懂在这
接入顶象滑动验证码

顶象滑动验证码注册账号 SDK下载后端实现 WEB端接入效果图注册账号由于是学习使用用的是免费的访问顶象官网注册账号后登录控制台访问无感验证模块申请开通后系统会分配一个唯一的AppId AppSecret SDK下载
python list写入、读取csv文件

csv 文件格式的本质是一种以文本存储的表格数据使用 Excel 工具即可读写 csv 文件 csv 文件的每行代表一行数据每行数据中每个单元格内的数据以逗号隔开按行写入csv文件话不多说直接上代码 import csv def s
vscode Ubuntu配置c++调试环境

1 安装 C C 扩展打开 Visual Studio Code 点击左侧的 Extensions 图标搜索并安装 C C 扩展这个扩展提供了 C C 开发所需的工具和功能 2 安装编译器 Ubuntu 默认情况下可能没有安装 C C
ES查询效率-Query、Filter&term

目的 Google上博客众说纷纭大同小异逻辑正确但略为混乱再此梳理出容易混淆的点 1 是否算分只与查询方式有关与是否term查询 match查询无关 Query查询查询上下文查询操作不仅仅会进行查询还会计算分值用于确定相关度
使用eclipse IDE搭建C/C++开发环境

visual studio 2008 功能是很强大但是我用到的仅仅是它的 visual C 部分而且组件很多大部分都不知道是什么用的安装下来快 2G 了对于 C 盘紧张我的来说无疑是一种浪费磁盘于是卸载了 visual stu
面向对象_匿名内部类在开发中的应用

匿名内部类在开发中的使用 package cn test interface Person public abstract void study class PersonDemo 接口名作为形式参数其实这里需要的不是接品而是该接品的实现
如何用树莓派借用计算机的显示屏,笔记本电脑当作树莓派的显示器

我们知道树莓派被称为微型PC 有很多人在拿到板子后无从下手也不知道该干嘛从哪儿开始有人看了我的文章后开始刷机刷系统刷完机依旧不知道如何是好然后又开始用 putty 尝试连接树莓派连接上以后面对一个黑漆漆的窗口一脸懵逼
服务器信号MBR,[讨论]Windows启动过程(MBR分析)

讨论 Windows启动过程 MBR分析 2013 9 17 13 33 12376 讨论 Windows启动过程 MBR分析 2013 9 17 13 33 12376 此处我分析系统操作系统加载前的事从按开机键开始有心人一起讨论下
tomcat源码分析连接coyote catalina

http blog csdn net aesop wubo article details 7630440 http blog csdn net cutesource article details 5091732
java服务器调试指南

在实际开发中总会遇到程序启动不起来或者运行结果不符合期望的情况如果是在本地直接debug就行了几乎人人都会但是如果到了远程大多数情况下我们可以看日志通过日志排查定位到问题但是如果你的日志不多或者日志中看不出问题此时情况就
图像识别流程学习总结

通过图像识别的学习初步总结了图像识别的流程及归类希望可以帮到正在学习的小伙伴一前期准备工作 1 数据集的获取在进行数据分析之前需要有数据进行识别这里所谓的数据指的是图像我们需要对需要识别的图像分好其类别才能更好的调用下面以天

图像识别流程学习总结

图像识别流程学习总结 的相关文章

随机推荐

热门标签

图像识别流程学习总结的相关文章