【动手学习pytorch笔记】9.卷积神经网络基础（卷积层，填充和步长，多输入输出通道，池化层）

2023-11-06

卷积层

二维互相关运算

import torch
from torch import nn
from d2l import torch as d2l

def corr2d(X, K):
    """计算二维互相关运算"""
    h, w = K.shape
    Y = torch.zeros((X.shape[0] - h + 1, X.shape[1] - w + 1))
    for i in range(Y.shape[0]):
        for j in range(Y.shape[1]):
            Y[i, j] = (X[i : i + h, j : j + w] * K).sum()        
    return Y

测试一下

X = torch.tensor([[0.0,1.0,2.0],
                  [3.0,4.0,5.0],
                  [6.0,7.0,8.0]])
K = torch.tensor([[0.0,1.0],
                  [2.0,3.0]])
corr2d(X, K)

输出

tensor([[19., 25.],
        [37., 43.]])

卷积类

class Conv2D(nn.Module):
    def __init__(self, kernel_size):
        super().__init__()
        self.weight = nn.Parameter(torch.rand(kernel_size))
        self.bias = nn.Parameter(torch.zeros(1))
    
    def forward(self, x):
        return corr2d(x, self.weight) + self.bias

把中间的变成0，看起来像图片边界

X = torch.ones((6, 8))
X[:, 2:6] = 0
X

tensor([[1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.]])

一个1*2的卷积核

K = torch.tensor([[1.0, -1.0]])

输出结果

Y = corr2d(X, K)
Y

输出

tensor([[ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.]])

把X转置一下再试试

corr2d(X.t(), K)

输出

tensor([[0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.]])

可见这个卷积核智能判定垂直边界

手动写一个卷积过程

conv2d = nn.Conv2d(1, 1, kernel_size=(1, 2), bias= False)

X = X.reshape((1, 1, 6, 8))
Y = Y.reshape((1, 1, 6, 7))

for i in range(10):
    Y_hat = conv2d(X)
    l = (Y_hat - Y ) ** 2
    conv2d.zero_grad()
    l.sum().backward()
    conv2d.weight.data[:] -= 3e-2 * conv2d.weight.grad
    if(i + 1) % 2 == 0:
        print(f'batch{i + 1}, loss {l.sum():.3f}')

nn.Conv2d（输入通道数，输出通道数，卷积核大小，偏移量）

X.reshape成一个四维变量（通道数，批量大小数，6, 8）

Y也一样

迭代10次学习卷积核参数

conv2d.weight.grad梯度

batch2, loss 5.869
batch4, loss 1.119
batch6, loss 0.243
batch8, loss 0.063
batch10, loss 0.020

看看学习到的参数

conv2d.weight.data.reshape((1, 2))

输出

tensor([[ 0.9751, -1.0009]])

可以看到10代之后和标准的[1.0, -1.0]很接近了

填充和步长

无步长

输出大小 = 输入 - 卷积核 + 填充 + 1

有步长

输出大小 = (输入 - 卷积核 + 填充 - 步长)/步长

import torch
from torch import nn

def comp_conv2d(conv2d, X):
    X = X.reshape((1, 1) + X.shape)
    Y = conv2d(X)
    
    return Y.reshape(Y.shape[2:])

conv2d = nn.Conv2d(1, 1, kernel_size = 3, padding = 1)
X = torch .rand(size = (8, 8))
comp_conv2d(conv2d, X).shape

X.reshape((1, 1) + X.shape)是加上通道数和小批次数[1 , 1]

Y.shape[2:]再把前两个维度通道数和小批次数[1 , 1]去掉

输出

torch.Size([8, 8])

8 - 3 + 2 + 1 = 8

例1

conv2d = nn.Conv2d(1, 1, kernel_size=(5, 3), padding=(2, 1))
comp_conv2d(conv2d, X).shape

输出

torch.Size([8, 8])

8 - 5 + 4 + 1 = 8

8 - 3 + 2 + 1 = 8

例2

conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1, stride = 2)
comp_conv2d(conv2d, X).shape

输出

torch.Size([4, 4])

(8 - 3 + 2 + 2) / 2 = 4.5 向下取整

例3

conv2d = nn.Conv2d(1, 1, kernel_size=(3, 4), padding=(0, 1), stride=(3, 4))
comp_conv2d(conv2d, X).shape

输出

torch.Size([2, 2])

(8 - 3 + 3) / 3向下取整 = 2

(8 - 4 + 2 + 4) / 4向下取整 = 2

多输入输出通道

多输入

在这里插入图片描述

import torch
from d2l import torch as d2l

def corr2d_multi_in(X, K):
    return sum(d2l.corr2d(x, k) for x, k in zip(X, K))

X = torch.tensor([[[0.0, 1.0, 2.0],
                   [3.0, 4.0, 5.0],
                   [6.0, 7.0, 8.0]],
                  
                  [[1.0, 2.0, 3.0],
                   [4.0, 5.0, 6.0],
                   [7.0, 8.0, 9.0]]])

K = torch.tensor([[[0.0, 1.0],
                   [2.0, 3.0]],
                  
                  [[1.0, 2.0],
                   [3.0, 4.0]]])

corr2d_multi_in(X, K)

X(2 * 3 * 3)

K(2 * 2 * 2)

tensor([[ 56.,  72.],
        [104., 120.]])

多输出

在这里插入图片描述

有Co组卷积核，Co个通道输出

def corr2d_multi_in_out(X, K):
    # 迭代“K”的第0个维度，每次都对输入“X”执行互相关运算。
    # 最后将所有结果都叠加在一起
    return torch.stack([corr2d_multi_in(X, k) for k in K], 0)

K = torch.stack((K, K+1, K+2), 0)
K.shape

torch.Size([3, 2, 2, 2])

tensor([[[[0., 1.],
          [2., 3.]],

         [[1., 2.],
          [3., 4.]]],


        [[[1., 2.],
          [3., 4.]],

         [[2., 3.],
          [4., 5.]]],
   

        [[[2., 3.],
          [4., 5.]],

         [[3., 4.],
          [5., 6.]]]])

corr2d_multi_in_out(X, K)

tensor([[[ 56.,  72.],
         [104., 120.]],

        [[ 76., 100.],
         [148., 172.]],

        [[ 96., 128.],
         [192., 224.]]])

1 * 1 卷积层

def corr2d_multi_in_out_1x1(X, K):
    c_i, h, w = X.shape
    c_o = K.shape[0]
    X = X.reshape((c_i, h * w))
    K = K.reshape((c_o, c_i))
    # 全连接层中的矩阵乘法
    Y = torch.matmul(K, X)
    return Y.reshape((c_o, h, w))

X = torch.normal(0, 1, (3, 3, 3))
K = torch.normal(0, 1, (2, 3, 1, 1))

Y1 = corr2d_multi_in_out_1x1(X, K)
Y2 = corr2d_multi_in_out(X, K)
assert float(torch.abs(Y1 - Y2).sum()) < 1e-6

相当于全连接层

池化层

缓解卷积层对位置的敏感性，同样有窗口大小，填充，步长，但不用学习参数，且对每个通道单独作用，输入通道是几输出就是几。

import torch
from torch import nn
from d2l import torch as d2l

def pool2d(X, pool_size, mode='max'):
    p_h, p_w = pool_size
    Y = torch.zeros((X.shape[0] - p_h + 1, X.shape[1] - p_w + 1))
    for i in range(Y.shape[0]):
        for j in range(Y.shape[1]):
            if mode == 'max':
                Y[i, j] = X[i: i + p_h, j: j + p_w].max()
            elif mode == 'avg':
                Y[i, j] = X[i: i + p_h, j: j + p_w].mean()
    return Y

和卷积层的互相关运算差不多

X = torch.tensor([[0.0, 1.0, 2.0], [3.0, 4.0, 5.0], [6.0, 7.0, 8.0]])
pool2d(X, (2, 2))

输出

tensor([[4., 5.],
        [7., 8.]])

pool2d(X, (2, 2), 'avg')

输出

tensor([[2., 3.],
        [5., 6.]])

填充和步幅

X = torch.arange(16, dtype=torch.float32).reshape((1, 1, 4, 4))
X

看看X

tensor([[[[ 0.,  1.,  2.,  3.],
          [ 4.,  5.,  6.,  7.],
          [ 8.,  9., 10., 11.],
          [12., 13., 14., 15.]]]])

pool2d = nn.MaxPool2d(3)
pool2d(X)

默认情况下，深度学习框架中的步幅与汇聚窗口的大小相同。因此，如果我们使用形状为(3, 3)的汇聚窗口，那么默认情况下，我们得到的步幅形状为(3, 3)。

pool2d = nn.MaxPool2d(3, padding=1, stride=2)
pool2d(X)

也可手动调整

tensor([[[[ 5.,  7.],
          [13., 15.]]]])

pool2d = nn.MaxPool2d((2, 3), stride=(2, 3), padding=(0, 1))
pool2d(X)

tensor([[[[ 5.,  7.],
          [13., 15.]]]])

多通道输入

X = torch.cat((X, X + 1), 1)
X

这里用cat不是stack是因为stack会新增加一个轴在新轴上拼接，但上面 X 已经 reshape((1, 1, 4, 4))所以用cat在现有的通道数所在轴进行拼接

tensor([[[[ 0.,  1.,  2.,  3.],
          [ 4.,  5.,  6.,  7.],
          [ 8.,  9., 10., 11.],
          [12., 13., 14., 15.]],

         [[ 1.,  2.,  3.,  4.],
          [ 5.,  6.,  7.,  8.],
          [ 9., 10., 11., 12.],
          [13., 14., 15., 16.]]]])

pool2d = nn.MaxPool2d(3, padding=1, stride=2)
pool2d(X)

输出

tensor([[[[ 5.,  7.],
          [13., 15.]],

         [[ 6.,  8.],
          [14., 16.]]]])

可以看到通道数输入的时候是2，输出的时候还是2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pytorch学习笔记

Pytorch

深度学习

卷积神经网络

cnn

【动手学习pytorch笔记】9.卷积神经网络基础（卷积层，填充和步长，多输入输出通道，池化层）的相关文章

如何避免 PyTorch 中的“CUDA 内存不足”

我认为对于 GPU 内存较低的 PyTorch 用户来说这是一个非常常见的消息 RuntimeError CUDA out of memory Tried to allocate X MiB GPU X X GiB total capac
Model() 获得参数“nr_class”的多个值 - SpaCy 多分类模型（BERT 集成）

您好我正在致力于使用新的 SpaCy 模型实现多分类模型 5 类 en pytt bertbaseuncased lg 新管道的代码在这里 nlp spacy load en pytt bertbaseuncased lg textcat
PyTorch 教程错误训练分类器

我刚刚开始 PyTorch 教程使用 PyTorch 进行深度学习 60 分钟闪电战我应该补充一点我之前没有编写过任何 python 但其他语言如 Java 现在我的代码看起来像 import torch import torchvi
在pytorch张量中过滤数据

我有一个张量X like 0 1 0 5 1 0 0 1 2 0 我想实现一个名为的函数filter positive 它可以将正数据过滤成新的张量并返回原始张量的索引例如 new tensor index filter positive
一次热编码期间出现 RunTimeError

我有一个数据集其中类值以 1 步从 2 到 2 i e 2 1 0 1 2 其中 9 标识未标记的数据使用一种热编码 self one hot encode labels 我收到以下错误 RuntimeError index 1 is
在非单一维度 1 处，张量 a (2) 的大小必须与张量 b (39) 的大小匹配

这是我第一次从事文本分类工作我正在使用 CamemBert 进行二进制文本分类使用 fast bert 库该库主要受到 fastai 的启发当我运行下面的代码时 from fast bert data cls import Bert
PyTorch 中复数矩阵的行列式

有没有办法在 PyTorch 中计算复矩阵的行列式 torch det未针对 ComplexFloat 实现不幸的是目前尚未实施一种方法是实现您自己的版本或简单地使用np linalg det 这是一个简短的函数它计算我使用 LU
如何计算 CNN 第一个线性层的维度

目前我正在使用 CNN 其中附加了一个完全连接的层并且我正在使用尺寸为 32x32 的 3 通道图像我想知道是否有一个一致的公式可以用来计算第一个线性层的输入尺寸和最后一个卷积最大池层的输入我希望能够计算第一个线性层的尺寸仅给出
将 Keras (Tensorflow) 卷积神经网络转换为 PyTorch 卷积网络？

Keras 和 PyTorch 使用不同的参数进行填充 Keras 需要输入字符串而 PyTorch 使用数字有什么区别如何将一个转换为另一个哪些代码在任一框架中获得相同的结果 PyTorch 还采用参数 in channels o
如何使用Python计算多类分割任务的dice系数？

我想知道如何计算多类分割的骰子系数这是计算二元分割任务的骰子系数的脚本如何循环每个类并计算每个类的骰子先感谢您 import numpy def dice coeff im1 im2 empty score 1 0 im1 numpy
pytorch 的 IDE 自动完成

我正在使用 Visual Studio 代码最近尝试了风筝这两者似乎都没有 pytorch 的自动完成功能这些工具可以吗如果没有有人可以推荐一个可以的编辑器吗谢谢你使用Pycharmhttps www jetbrains co
Fine-Tuning DistilBertForSequenceClassification：不是学习，为什么loss没有变化？权重没有更新？

我对 PyTorch 和 Huggingface transformers 比较陌生并对此尝试了 DistillBertForSequenceClassificationKaggle 数据集 https www kaggle com c
PyTorch 给出 cuda 运行时错误

我对我的代码做了一些小小的修改以便它不使用 DataParallel and DistributedDataParallel 代码如下 import argparse import os import shutil import time
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0
Pytorch .to('cuda') 或 .cuda() 不起作用并且卡住了

我正在尝试做 pytorch 教程当我尝试将他们的设备设置为 cuda 时它不起作用并且我的代码运行被卡住有关具体信息我正在使用 conda 环境蟒蛇3 7 3 火炬1 3 0 cuda 10 2 NVIDIA RTX2080TI
如何在不安装pytorch的情况下使用pytorch预训练模型？

我只想在 pytorch 中使用预先训练的模型而不安装整个包我可以从 pytorch 复制模型模块吗恐怕你不能这样做为了运行模型你不仅需要经过训练的权重 pth tar 文件还需要网络的结构即层它们如何相互连接等该网络结
Pytorch TypeError：eq() 收到无效的参数组合

num samples 10 def predict x sampled models guide None None for in range num samples yhats model x data for model in sam
如何以干净高效的方式在 pytorch 中获得小批量？

我试图做一件简单的事情即使用火炬通过随机梯度下降 SGD 训练线性模型 import numpy as np import torch from torch autograd import Variable import pdb def
使用 CNN 和 pytorch 计算每个类别的准确度

我可以使用此代码计算每个时期后的准确性但是我想最后计算每个班级的准确性我怎样才能做到这一点我有两个文件夹 train 和 val 每个文件夹有 7 个不同类别的 7 个文件夹 train 文件夹用于训练否则 val 文件夹用于测试
如何让火车装载机使用特定数量的图像？

假设我正在使用以下调用 trainset torchvision datasets ImageFolder root imgs transform transform trainloader torch utils data DataLoa

随机推荐

elasticsearch启动报错

系统操作centos7 虚拟机 bin elasticsearch 启动报错 es1 es1 software elasticsearch 6 3 1 bin elasticsearch Exception in thread main
误差函数erf

1 erf误差函数介绍 erf 是误差函数它是高斯概率密度函数的积分性质 2 erf误差函数在matlab中实现 erf函数在matlab里面可以直接作为内置函数使用 erf 0 与下面式子等价 syms s f f exp s 2 e
AcWing 3375. 成绩排序

题目题目链接3375 成绩排序思路思路要求稳定排序或者特判的快排写法一写两个sort中的比较函数的参数cmp 写法二直接在结构体中进行比较写法三归并排序代码1 include
Win11 Vmware 16 Pro 启动报错 ‘0xc000007b‘

一段时间没有使用Vmware 打开突然报错 0xc000007b 可能是因为安装了其他软件导致C 库被改变原因 C 库改变解决方法 windows打开控制面板然后打开程序卸载程序图中左下角然后找到图中两个C 程序分别右键卸载
YoloV8改进策略：将FasterNet与YoloV8深度融合，打造更快更强的检测网络

文章目录数据集官方模型的成绩改进一改进二改进三总结数据集本来想选COCO数据集但是我觉得训练相同的epoch是一种不公平的对比因为预训练本来就是COCO数据集上得来的这样对官方的模型有利而我改动了模型的结构导致了没
【重点突破】—— 百度地图在React单页面应用中的使用

重点突破百度地图在React单页面应用中的使用前言百度地图是网页中使用地图的常用第三方工具这里结合React项目中学到的应用场景总结一些使用要点一在网页中嵌入百度地图搜百度地图开放平台注册百度开发者账号控制台查看应用创
QT的使用（初期笔记）

signal 发送的信号 signals 自定义信号返回值是void 只需声明不需实现可以有参数可以重载按钮 1 inherited 继承 from QAbstractButton 1 clicked bool checked f
idea2021版本新建web项目(详细教程)

打开idea右上角的文件新建项目选中java模块下一步取名下一步打开后是个空白到这一步右键选中untitled打开添加框架支持选中web应用程序一定要勾选创建web xml 然后点击确定接下来找到右上角的添加配置点
matplotlib绘图横坐标或纵坐标文本显示不全

import matplotlib pyplot as plt x 1 2 3 4 y 1 4 9 6 labels Frogs Hogs Bogs Slogs plt plot x y You can specify a rotation
unity使用Tcp/UDP协议网络通信实现(Socket简单应用)

一 TCP协议服务器端 1 打开vs 创建一个c 的控制台应用程序代码如下记得把ip换成自己电脑ip using System using System Collections Generic using System Linq us
INS/GNSS组合导航（七）角速度坐标系变换与欧拉角转换

注意角速度与角速度率有严格区别反映在以下两点正交的三个角速度角速度矢量与欧拉角速率之间的关系如下欧拉角速率并不是纯粹的正交矢量而是一个与旋转顺序相关而且非正交的三个矢量积分欧拉角速率得到的是欧拉角的大小又称卡丹角积分角速
股票预测_机器学习预测股票

2 机器学习技术综述集成多种人工智能系统的机器学习技术尝试通过对历史数据的学习提取数据模式这一过程被称为训练或学习其目的在于实现后续基于新数据的预测 Xiao Xiao Lu and Wang 2013 pp 99 100 使用机器学
【Java】类和对象

前言面向对象编程的特性封装继承多态在Java中最基本的封装单元是类一个类的定义为具有相似特征对象的一种抽象根据类的继承父类只定义各子类所需的属性和方法多态是类中同一名称的行为可以有多种不同的功能文章目录前言一类
Mybatis Generator 配置详解

许多人在Java项目中都会到使用Mybatis Generator这个工具包这里把这个工具的配置完整列一下 gt
spss常态检验_利用SPSS检验数据是否符合正态分布

利用SPSS检验数据是否符合正态分布正态分布也叫常态分布在我们后面说的很多东西都需要数据呈正态分布下面的图就是正态分布曲线中间隆起对称向两边下降下面我们来看一组数据并检验期初平均分数据是否呈正态分布此数据已在SPSS里输
Sentinel-持久化

直接使用dashboard和sentinel配置各种规则时默认是存在了内存中如果服务器重启那么数据就会丢失从而Sentinel提供了5中持久化的方式将各种配置数据进行持久化若服务器重启就重新加载持久化的数据防止数据丢失 1 持久
使用adb查看安装包的apk路径与清除安装包数据与缓存操作实例

adb shell pm path
【Stata】CGSS数据清理：Codebook速成法

对数据使用者来说了解一个调查数据基本情况的常见途径就是查看该数据的codebook 对数据所有者提供方来说制作一份详细的codebook是其数据管理工作中不可或缺的一环 2016年上半年CGSS项目组把CGSS2003年到CGSS20
解决Ubuntu安装后无法联网的问题-网卡驱动为安装成功

转载自 http blog csdn net ifmvo article details 54023628 t0 起因屁话最近由于公司电脑不够用所以暂时使用自己的笔记本做开发 i5 4G win7这配置看个视频听个音乐还好可我是做
【动手学习pytorch笔记】9.卷积神经网络基础（卷积层，填充和步长，多输入输出通道，池化层）

卷积层二维互相关运算 import torch from torch import nn from d2l import torch as d2l def corr2d X K 计算二维互相关运算 h w K shape Y torch

【动手学习pytorch笔记】9.卷积神经网络基础（卷积层，填充和步长，多输入输出通道，池化层）

卷积层

二维互相关运算

卷积类

手动写一个卷积过程

填充和步长

多输入输出通道

多输入

多输出

1 * 1 卷积层

池化层

填充和步幅

多通道输入

【动手学习pytorch笔记】9.卷积神经网络基础（卷积层，填充和步长，多输入输出通道，池化层） 的相关文章

随机推荐

热门标签

【动手学习pytorch笔记】9.卷积神经网络基础（卷积层，填充和步长，多输入输出通道，池化层）的相关文章