LeNet-5识别数字

2023-11-14

LeNet识别数字

前言
环境
实现
结果

前言

实现经典卷积神经网络LeNet(LeNet-5)识别数字，这里将激活函数从sigmoid换成ReLU，参考资料《动手学深度学习》。

环境

python+pytorch

实现

import torch
import torch.nn as nn
import torchvision
import matplotlib.pyplot as plt
from torch.utils import data
from torchvision import transforms
import cv2 as cv

#下载数据集
trans = transforms.ToTensor()
mnist_train = torchvision.datasets.MNIST(
    root="./drive/MyDrive/ex/data", transform=trans, train=True, download=True) 
mnist_test = torchvision.datasets.MNIST(
    root="./drive/MyDrive/ex/data", transform=trans, train=False, download=True)
# root后的路径为数据集下载后的保存路径

# 定义网络
class Reshape(nn.Module):
    def forward(self, x):
        return x.view(-1, 1, 28, 28)

net = nn.Sequential(
    Reshape(),
    nn.Conv2d(1, 6, kernel_size=5, padding=2), nn.ReLU(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Conv2d(6, 16, kernel_size=5), nn.ReLU(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Flatten(),
    nn.Linear(16 * 5 * 5, 120), nn.ReLU(),
    nn.Linear(120, 84), nn.ReLU(),
    nn.Linear(84, 10))

#读取数据
batch_size = 256
train_iter = data.DataLoader(mnist_train, shuffle=True, batch_size=batch_size, num_workers=4)
test_iter = data.DataLoader(mnist_test, shuffle=True, batch_size=batch_size, num_workers=4)

class Accumulator:
    """在`n`个变量上累加。"""
    def __init__(self, n):
        self.data = [0.0] * n

    def add(self, *args):
        self.data = [a + float(b) for a, b in zip(self.data, args)]

    def reset(self):
        self.data = [0.0] * len(self.data)

    def __getitem__(self, idx):
        return self.data[idx]

def accuracy(y_hat, y):
    """计算预测正确的数量。"""
    if len(y_hat.shape) > 1 and y_hat.shape[1] > 1:
        y_hat = y_hat.argmax(axis=1)
    cmp = y_hat.type(y.dtype) == y
    return float(cmp.type(y.dtype).sum())

def evaluate_accuracy_gpu(net, data_iter, device=None):
    """使用GPU计算模型在数据集上的精度。"""
    if isinstance(net, nn.Module):
        net.eval()  # 设置为评估模式
        if not device:
            device = next(iter(net.parameters())).device
    # 正确预测的数量，总预测的数量
    metric = Accumulator(2)
    for X, y in data_iter:
        if isinstance(X, list):
            X = [x.to(device) for x in X]
        else:
            X = X.to(device)
        y = y.to(device)
        metric.add(accuracy(net(X), y), y.numel())
    return metric[0] / metric[1]

def train(net, train_iter, test_iter, num_epochs, lr, device):
    """用GPU训练"""
    def init_weights(m):
      if type(m) == nn.Linear or type(m) == nn.Conv2d:
            nn.init.xavier_uniform_(m.weight)
    net.apply(init_weights)
    net.to(device)
    optimizer = torch.optim.SGD(net.parameters(), lr=lr)
    loss = nn.CrossEntropyLoss()
    for epoch in range(num_epochs):
        metric = Accumulator(3)
        net.train()
        for i, (X, y) in enumerate(train_iter):
            optimizer.zero_grad()
            X, y = X.to(device), y.to(device)
            y_hat = net(X)
            l = loss(y_hat, y)
            l.backward()
            optimizer.step()
            with torch.no_grad():
                metric.add(l * X.shape[0], accuracy(y_hat, y), X.shape[0])
            train_l = metric[0] / metric[2]
            train_acc = metric[1] / metric[2]
        test_acc = evaluate_accuracy_gpu(net, test_iter)
    print(f'loss {train_l:.3f}, train acc {train_acc:.3f}, '
          f'test acc {test_acc:.3f}')

lr, num_epochs = 0.1, 10
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
train(net, train_iter, test_iter, num_epochs, lr, device)

def get_mnist_labels(labels):
    """返回数字标签。"""
    text_labels = ['0', '1', '2', '3', '4',
                   '5', '6', '7', '8', '9']
    return [text_labels[int(i)] for i in labels]
def show_image(img_tensor):
	"""用于数据集中的显示图片"""
      plt.imshow(img.numpy())
      plt.axis('off')

def predict(net, device=None):
    """预测图片数字"""
    if isinstance(net, nn.Module):
        net.eval()  # 设置为评估模式
        if not device:
            device = next(iter(net.parameters())).device
    img = cv.imread('./drive/MyDrive/ex/data/MNIST/test.png') # 放预测图片的位置，图片大小为28*28，黑底白字
    img = cv.cvtColor(img, cv.COLOR_RGB2GRAY)
    transf = transforms.ToTensor()
    img_tensor = transf(img)
    show_image(img_tensor)
    pred = get_mnist_labels(net(img_tensor).argmax(axis=1))
    print(pred)

predict(net)

结果

loss:0.046, train accuracy:0.986, test accuracy:0.978

导入下面的预测图片
导入的预测图片

导入的图片显示效果和识别的数字。
结果图片

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习

Pytorch

深度学习

人工智能

LeNet-5识别数字的相关文章

如何在pytorch中查看DataLoader中的数据

我在 Github 上的示例中看到类似以下内容如何查看该数据的类型形状和其他属性 train data MyDataset int 1e3 length 50 train iterator DataLoader train data b
在非单一维度 1 处，张量 a (2) 的大小必须与张量 b (39) 的大小匹配

这是我第一次从事文本分类工作我正在使用 CamemBert 进行二进制文本分类使用 fast bert 库该库主要受到 fastai 的启发当我运行下面的代码时 from fast bert data cls import Bert
从打包序列中获取每个序列的最后一项

我试图通过 GRU 放置打包和填充的序列并检索每个序列最后一项的输出当然我的意思不是 1项目但实际上是最后一个未填充的项目我们预先知道序列的长度因此应该很容易为每个序列提取length 1 item 我尝试了以下方法 impor
使 CUDA 内存不足

我正在尝试训练网络但我明白了我将批量大小设置为 300 并收到此错误但即使我将其减少到 100 我仍然收到此错误更令人沮丧的是在 1200 个图像上运行 10 epoch 大约需要 40 分钟有什么建议吗错了我怎样才能加快这
BatchNorm 动量约定 PyTorch

Is the 批归一化动量约定 http pytorch org docs master modules torch nn modules batchnorm html 默认 0 1 与其他库一样正确例如Tensorflow默认情况下似乎
Pytorch ValueError：优化器得到一个空参数列表

当尝试创建神经网络并使用 Pytorch 对其进行优化时我得到了 ValueError 优化器得到一个空参数列表这是代码 import torch nn as nn import torch nn functional as F fro
如何使用pytorch构建多任务DNN，例如超过100个任务？

下面是使用 pytorch 为两个回归任务构建 DNN 的示例代码这forward函数返回两个输出 x1 x2 用于大量回归分类任务的网络怎么样例如 100 或 1000 个输出对所有输出例如 x1 x2 x100 进行硬编码绝对
如何有效地对一个数组中某个值在另一个数组中的位置出现的次数求和

我正在寻找一种有效的 for 循环避免解决方案来解决我遇到的数组相关问题我想使用一个巨大的一维数组 A gt size 250 000 用于一维索引的 0 到 40 之间的值以及用于第二维索引的具有 0 到 9995 之间的值的相同大
如何使用Python计算多类分割任务的dice系数？

我想知道如何计算多类分割的骰子系数这是计算二元分割任务的骰子系数的脚本如何循环每个类并计算每个类的骰子先感谢您 import numpy def dice coeff im1 im2 empty score 1 0 im1 numpy
预期设备类型为 cuda 的对象，但在 Pytorch 中获得了设备类型 cpu

我有以下计算损失函数的代码 class MSE loss nn Module metric L1 L2 norms or cosine similarity mode training or evaluation mode def init
TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee
对 FastAI 中的数据应用图像增强转换时出错

我正在尝试复制这个 Kaggle 笔记本https www kaggle com tanlikesmath diabetic retinopathy with resnet50 oversampling https www kaggle c
Pytorch .to('cuda') 或 .cuda() 不起作用并且卡住了

我正在尝试做 pytorch 教程当我尝试将他们的设备设置为 cuda 时它不起作用并且我的代码运行被卡住有关具体信息我正在使用 conda 环境蟒蛇3 7 3 火炬1 3 0 cuda 10 2 NVIDIA RTX2080TI
如何在不安装pytorch的情况下使用pytorch预训练模型？

我只想在 pytorch 中使用预先训练的模型而不安装整个包我可以从 pytorch 复制模型模块吗恐怕你不能这样做为了运行模型你不仅需要经过训练的权重 pth tar 文件还需要网络的结构即层它们如何相互连接等该网络结
Google Colab 使用 Transformers 和 PyTorch 微调 BERT Base Case 时出现间歇性“RuntimeError: CUDA out of memory”错误

我正在运行以下代码来微调 Google Colab 中的 BERT Base Cased 模型有时代码第一次运行良好没有错误其他时候相同的代码使用相同的数据会导致 CUDA 内存不足错误以前重新启动运行时或退出笔记本返回笔
Pytorch 中是否有一种方法可以以可反向传播的方式计算唯一值的数量？

给定以下张量这是网络的结果注意 grad fn tensor 121 241 125 1 108 238 125 121 13 117 121 229 161 13 0 202 161 121 121 0 121 121 242 125
如何将 35 类城市景观数据集转换为 19 类？

以下是我的代码的一小段使用它我可以在城市景观数据集上训练名为 lolnet 的模型但数据集包含 35 个类别标签 0 34 imports trainloader torch utils data DataLoader datase
softmax_cross_entropy_with_logits 的 PyTorch 等效项

我想知道 TensorFlow 是否有等效的 PyTorch 损失函数softmax cross entropy with logits TensorFlow 是否有等效的 PyTorch 损失函数softmax cross entropy
当前向包含多个自动分级节点时，PyTorch 关于使用非完整后向挂钩的警告

最近升级后当运行 PyTorch 循环时我现在收到警告当前向包含多个自动分级节点时使用非完整后向钩子训练仍在运行并完成但我不确定应该将其放置在哪里register full backward hook功能我尝试将它添加到神经网络
PyTorch 中的数据增强

我对 PyTorch 中执行的数据增强有点困惑现在据我所知当我们执行数据增强时我们保留原始数据集然后添加它的其他版本翻转裁剪等但 PyTorch 中似乎并没有发生这种情况据我从参考文献中了解到当我们使用data tra

随机推荐

C++不定参数，模板函数，模板类详解附实例

前言在 C 中有时我们在写一个函数时并不知道参数的数量和类型这时需要用到不定参数模板函数正文不定参数不定参数怎么表示对于不定参数的表示就是三个点注意是英文的点那么我们在正常使用时函数参数写成这样 funtionType
Python 容器序列切片

视频版教程 Python3零基础7天入门实战视频教程序列是指内容连续且有序的一类数据容器前面学的列表元组字符串都是序列并且支持下标索引切片是指从一个序列中取出一个子序列语法序列起始下标结束下标步长返回一个新的序列
短文阅读3：Variational Autoencoders (VAEs)

深度生成网络 VAEs introduction 降维方法 PCA and Autoencoders 降维架构 PCA 问题1 什么是自动编码器autoencoder PCA和Autoencoders之间的关系 Variational Au
【建议收藏】数据库 SQL 入门——数据查询操作（内附演示）

引言在上一节中我们讨论了DML的使用方法本节我们继续开始DQL的学习首先回归一下DQL的基于定义 DQL Data Query Language 数据查询语言用来查询数据库中表的记录在本节中我们主要讨论DQL的用法以及基本语法
计算机视觉之人脸识别(Yale数据集)--HOG和ResNet两种方法实现

1 问题描述在给定Yale数据集上完成以下工作在给定的人脸库中通过算法完成人脸识别算法需要做到能判断出测试的人脸是否属于给定的数据集如果属于需要判断出测试的人脸属于数据集中的哪一位否则需要声明测试的人脸不属于数据集这是一个
思维导图函数
PCL点云处理之最小二乘空间直线拟合（3D）（二百零二）

PCL点云处理之最小二乘空间直线拟合 3D 二百零二一算法简介二实现代码三效果展示一算法简介对于空间中的这样一组点大致呈直线分布散乱分布在直线左右我们可采用最小二乘方法拟合直线更进一步地可以通过点到直线的投影最
5款程序员必备的免费在线画图工具，超级好用！

点击上方芋道源码选择设为星标管她前浪还是后浪能浪的浪才是好浪每天 10 33 更新文章每天掉亿点点头发源码精品专栏原创 Java 2021 超神之路很肝中文详细注释的开源项目 RPC 框架 Dubbo 源码解析网
java中的集合基础

集合介绍集合类的特点提供一种存储空间可变的存储模型存储的数据容量可以发生改变集合和数组的区别共同点都是存储数据的容器不同点数组的容量是固定的集合的容量是可变的数组可以存基本数据类型和引用数据类型集合只能存引用数据类型
【Android进阶篇】WebView显示网页详解

概述 WebView是Android用于显示网页的控件通过WebView 我们可以查看本地的网页也可以查看网络资源本文内容如下一加载本地网页二加载网络资源三在WebView中使用JavaScript和CSS 四 WebCh
多线程案例(1) - 单例模式

目录单例模式饿汉模式懒汉模式前言多线程中有许多非常经典的设计模式这就类似于围棋的棋谱这是用来解决我们在开发中遇到很多经典场景简单来说设计模式就是一份模板可以套用单例模式顾名思义就是一个程序只能含有一个实例有的场
Permission denied

Permission denied 出现的原因的是没有权限进行读写创建文件删除文件等操作解决方法输入命令 sudo chmod R 777 工作目录例如 sudo chmode R 777 home HDD 此时就可以在该路径
poium测试库介绍

poium测试库前身为selenium page objects测试库我在以前的文章中也有介绍过这可能是最简单的Page Object库项目的核心是基于Page Objects实现元素定位的封装该项目由我个人在维护目前在公司项目中
使用ChatGPT的方式与在其他地方使用它的方式基本相同。以下是一些步骤：

在中国使用ChatGPT的方式与在其他地方使用它的方式基本相同以下是一些步骤访问OpenAI的官方网站 OpenAI 在网站上找到GPT 3或ChatGPT的相关信息 OpenAI提供了详细的API文档可以帮助你理解如何使用它们你需
mysql数据库之跨表复制

背景说明目标库 target db 目标数据表 target tb 将目标库的制定表复制到当前数据库中包括一下几个方面一表结构复制仅仅复制了表的结构没有数据 create table current db new tb like
Logitech G系鼠标脚本编程，实现鼠标自动定位控制

利用罗技官方提供的API来写一个鼠标自动定位移动脚本点击脚本编辑器中的帮助选项查看罗技官方提供的API说明有很多实现好的鼠标功能 G series Lua API V8 45 Overview and Reference 下面是我写的
深入解析SpringBoot启动原理

1 启动类中的SpringApplication run方法会创建一个SpringApplication的实例并做一些初始化工作 SpringBootApplication Slf4j public class HuotuUserServ
Linux C编程基础：获取时间

1 前言对于linux下的编程无论是用户态还是内核态时间获取都是经常需要使用到的以下分别从用户态和内核态整理了几个常用的时间获取接口供编写代码时快速查阅 linux时间子系统的发展历史及详细介绍可以参考深入理解Linux时间子
stm32 机械周期_STM32定时器周期计算

STM32定时器周期计算公式是 1 TIM Prescaler 时钟 1 TIM Period F103配置生成1ms的时钟 1 35 36M 1 999 1MS TIM TimeBaseInitTypeDef TIM TimeBaseS
LeNet-5识别数字

LeNet识别数字前言环境实现结果前言实现经典卷积神经网络LeNet LeNet 5 识别数字这里将激活函数从sigmoid换成ReLU 参考资料动手学深度学习环境 python pytorch 实现 import tor

LeNet-5识别数字

LeNet识别数字

前言

环境

实现

结果

LeNet-5识别数字 的相关文章

随机推荐

热门标签

LeNet-5识别数字的相关文章