Pytorch nn.Module模块详解

2023-11-10

torch.nn是专门为神经网络设计的模块化接口. nn构建于autograd之上，可以用来定义和运行神经网络。
nn.Module是nn中十分重要的类，包含网络各层的定义及forward方法。

如何定义自己的网络：

需要继承nn.Module类，并实现forward方法。继承nn.Module类之后，在构造函数中要调用Module的构造函数, super(Linear, self).init()
一般把网络中具有可学习参数的层放在构造函数__init__()中。
不具有可学习参数的层（如ReLU）可放在构造函数中，也可不放在构造函数中（而在forward中使用nn.functional来代替）。可学习参数放在构造函数中，并且通过nn.Parameter()使参数以parameters（一种tensor,默认是自动求导）的形式存在Module中，并且通过parameters()或者named_parameters()以迭代器的方式返回可学习参数。
只要在nn.Module中定义了forward函数，backward函数就会被自动实现（利用Autograd)。而且一般不是显式的调用forward(layer.forward), 而是layer(input), 会自执行forward().
在forward中可以使用任何Variable支持的函数，毕竟在整个pytorch构建的图中，是Varible在流动。还可以使用if, for, print, log等python语法。

值得注意的是：
Pytorch基于nn.Module构建的模型中，只支持mini-batch的Variable输入方式。比如，只有一张输入图片，也需要变成NxCxHxW的形式：

input_image = torch.FloatTensor(1, 28, 28)
input_image = Variable(input_image)
input_image = input_image.unsqueeze(0)     # 1 x 1 x 28 x 28

如何把nn的层连接起来

我们发现每一层的输出作为下一层的输入，这种前馈nn可以不用每一层都重复的写forward()函数，通过Sequential()和ModuleList()，可以自动实现forward。这两个函数都是特殊module, 包含子module。ModuleList可以当成list用，但是不能直接传入输入。

Sequential构造方法

net1 = nn.Sequential()
net1.add("conv", nn.Conv2d(3, 3, 5))
net1.add("batchnorm", nn.BatchNorm2d(3))
访问方式： net1.conv(input)

net2 = nn.Sequential(nn.Conv2d(3, 3, 5), nn.BatchNorm2d(3))
访问方式： net2[0]

net3 = nn.Sequential(Order([("conv", nn.Conv2d(3, 3, 5)), ("batchnorm", nn.BatchNorm2d(3)), ()]))
访问方式： net3.conv(input)

ModuleList构造方法

modulelist=nn.ModuleList([ nn.Conv2d(3,3,6),nn.BatchNorm(3) ])

访问方式：
for model in modulelist:
input=modullist(input)

Reference:
https://www.cnblogs.com/zmmz/p/9830278.html
https://blog.csdn.net/e01528/article/details/84075090
https://blog.csdn.net/u012609509/article/details/81203436

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

深度学习

Pytorch nn.Module模块详解的相关文章

为什么 PyTorch nn.Module.cuda() 不将模块张量移动到 GPU，而仅将参数和缓冲区移动到 GPU？

nn Module cuda 将所有模型参数和缓冲区移动到 GPU 但为什么不是模型成员张量呢 class ToyModule torch nn Module def init self gt None super ToyModule se
在 PyTorch 中原生测量多类分类的 F1 分数

我正在尝试在 PyTorch 中本地实现宏 F1 分数 F measure 而不是使用已经广泛使用的sklearn metrics f1 score https scikit learn org stable modules generat
LSTM 错误：AttributeError：“tuple”对象没有属性“dim”

我有以下代码 import torch import torch nn as nn model nn Sequential nn LSTM 300 300 nn Linear 300 100 nn ReLU nn Linear 300 7
使 CUDA 内存不足

我正在尝试训练网络但我明白了我将批量大小设置为 300 并收到此错误但即使我将其减少到 100 我仍然收到此错误更令人沮丧的是在 1200 个图像上运行 10 epoch 大约需要 40 分钟有什么建议吗错了我怎样才能加快这
pytorch 中的 autograd 可以处理同一模块中层的重复使用吗？

我有一层layer in an nn Module并在一次中使用两次或多次forward步这个的输出layer稍后输入到相同的layer pytorch可以吗autograd正确计算该层权重的梯度 def forward x x self
PyTorch LSTM：运行时错误：无效参数 0：张量的大小必须匹配，维度 0 除外。维度 1 为 1219 和 440

我有一个基本的 PyTorch LSTM import torch nn as nn import torch nn functional as F class BaselineLSTM nn Module def init self su
Blenderbot 微调

我一直在尝试微调 HuggingFace 的对话模型 Blendebot 我已经尝试过官方拥抱脸网站上给出的传统方法该方法要求我们使用 trainer train 方法来完成此操作我使用 compile 方法尝试了它我尝试过使用 Py
将 Keras (Tensorflow) 卷积神经网络转换为 PyTorch 卷积网络？

Keras 和 PyTorch 使用不同的参数进行填充 Keras 需要输入字符串而 PyTorch 使用数字有什么区别如何将一个转换为另一个哪些代码在任一框架中获得相同的结果 PyTorch 还采用参数 in channels o
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable
样本（）和r样本（）有什么区别？

当我从 PyTorch 中的发行版中采样时两者sample and rsample似乎给出了类似的结果 import torch seaborn as sns x torch distributions Normal torch tens
PyTorch 给出 cuda 运行时错误

我对我的代码做了一些小小的修改以便它不使用 DataParallel and DistributedDataParallel 代码如下 import argparse import os import shutil import time
对 FastAI 中的数据应用图像增强转换时出错

我正在尝试复制这个 Kaggle 笔记本https www kaggle com tanlikesmath diabetic retinopathy with resnet50 oversampling https www kaggle c
Pytorch - 推断线性层 in_features

我正在构建一个玩具模型来获取一些图像并进行分类我的模型看起来像 conv2d gt pool gt conv2d gt linear gt linear 我的问题是当我们创建模型时我们必须计算第一个线性层的大小in features基
如何将 35 类城市景观数据集转换为 19 类？

以下是我的代码的一小段使用它我可以在城市景观数据集上训练名为 lolnet 的模型但数据集包含 35 个类别标签 0 34 imports trainloader torch utils data DataLoader datase
没有名为“torch”或“torch.C”的模块

希望得到像我 5 这样的解释因为我已经检查了所有相关答案但没有一个有帮助我已经安装了Python 我已经安装了Pycharm 我已经安装了Anaconda 我已经安装了 Microsoft Visual Studio 我有not安装了
使用 Huggingface 变压器仅保存最佳权重

目前我正在使用 Huggingface transformers 构建一个新的基于 Transformer 的模型其中注意力层与原始模型不同我用了run glue py检查我的模型在 GLUE 基准测试上的性能但是我发现huggi
如何解决错误：PyTorch 中预期输入批量大小与目标批量大小不匹配？

我尝试通过 PyTorch 在 CIFAR10 数据集上创建逻辑模型但是我收到错误 ValueError 预期输入batch size 900 与目标batch size 300 匹配我认为正在发生的事情是 3 100 是 300 所以
PyTorch 如何计算二阶雅可比行列式？

我有一个正在计算向量的神经网络u 我想计算关于输入的一阶和二阶雅可比矩阵x 单个元素有人知道如何在 PyTorch 中做到这一点吗下面是我项目中的代码片段 import torch import torch nn as nn class
将 Pytorch 模型 .pth 转换为 onnx 模型

我有一个预训练的模型其格式为 pth 扩展名我想将其转换为 Tensorflow protobuf 但我没有找到任何方法来做到这一点我见过 onnx 可以将模型从 pytorch 转换为 onnx 然后从 onnx 转换为 Tenso
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4

随机推荐

maven子工程application文件失效

按照如下进行操作
ubuntu下载goalng-1.9

一安装这里以安装golang1 9为例 1 首先通过命令行直接安装 sudo apt get install golang 1 9 2 下载好之后查看go的版本 catik catik Aspire V3 471 go version
2023杭电暑假多校6 题解 1 2 6 10

文章目录 1 Count 2 Pair Sum and Perfect Square https vjudge csgrandeur cn problem HDU 7337 6 Perfect square number https vju
C++中的拷贝构造函数

1 拷贝构造函数拷贝构造函数是一种特殊的构造函数它在创建对象时是使用同一类中之前创建的对象来初始化新创建的对象拷贝构造函数通常用于 a 当用类的一个对象去初始化该类的另一个对象或引用时系统自动调用拷贝构造函数实现拷贝赋值 b 若
微信小程序开发（二）微信小程序的调试和发布

调试编译和预览预览点击预览可以使用微信扫描二维码在手机上安装测试版小程序或者点击自动预览可以连接手机微信或者直接在电脑端打开小程序预览发布上传代码发布项目工具上传确定编辑版本号和描述点击上传上传成功点击下载
mysql错误代码1045的原因及解决方案、Mysql服务没找到？

mysql错误代码1045的原因及解决方案 Mysql服务没找到再一次接触数据库时想要用工具连接数据库的时候出现了错误 Acess denied for localhost 忘了应该是服务器的问题就去重启了一下服务器 net st
【Ant Design of Vue】Tree 树形控件双击树节点禁止取消选中（两种方法）

一需求 Ant Design of Vue官网中第一次点击树节点会选中再一次点击该树节点会取消选中如图所示现有如下需求根据左侧选中树节点去请求接口获取右侧表格数据第一次点击树节点则选中再一次点击该树节点不会取消选中不会取
通过js date对象获取各种开始结束日期的示例

有时候做一些任务计划的功能时候需要提供一个开始时间或者结束时间比如本周结束本月结束今天结束等等因此我参考网上的资料把相关的实现为一个项目 gitee https gitee com dhclly icedog date edge
深度学习------tensorflow卷积神经网络:cifar数据集

1 cifar10数据集介绍 CIFAR 10数据集由10个类的60000个32x32彩色图像组成每个类有6000个图像有50000个训练图像和10000个测试图像数据集分为五个训练批次和一个测试批次每个批次有10000个图像测试
Dofbot机械臂从零部署笔记（4）——ROS之Moveit下实现实机逆向运动学规划

文章目录编译代码逆向运动学规划例子代码和运行效果关于老是规划失败逆向运动学Moveit编程步骤代码修正本节接上节实现逆向运动学规划本节源代码位于 home jetson dofbot ws src dofbot movei
linux重置电池阀值,Thinkpad在linux(ubuntu)下修改电池充电阈值，成功解决Thinkpad在Linux下的电池充电问题...

安装tp smapi aptitude install tp smapi dkms modprobe tp smapi 更改充电阈值设置开始充电阈值如从 60 开始充电 echo 60 gt sys devices platform s
手势虚拟键盘

定义一个HandDetector类 import cv2 import mediapipe as mp import math class HandDetector Finds Hands using the mediapipe libra
Docker的学习体验

由于兴致使然便想学习一点Docker技术于是写了这篇学习Docker的体会笔拙见谅第一件事把网线插上相信很多人都被官网的 Sample application 的docker build t getting started
Android 抛弃原生WebView，使用腾讯X5内核、并加入广告拦截。

大家都不知道原生的WebView 存在各种坑各种适配问题最近在使用总会出现DNS被拦截的情况预览了各个大神的论坛与博客发现可以更改WebView内核找到了比较火的两个分别是腾讯X5内核和 crosswalk crosswa
数据结构实验报告-实验一顺序表、单链表基本操作的实现

实验一顺序表单链表基本操作的实现 l 实验目的 1 顺序表 1 掌握线性表的基本运算 2 掌握顺序存储的概念学会对顺序存储数据结构进行操作 3 加深对顺序存储数据结构的理解逐步培养解决实际问题的编程能力 l 实验内容 1 顺序表 1
关于如何生成ssh密钥--远程访问的第一步

第一步从git官网下载windows版本的git http git scm com downloads 第二步写入以下系统path环境变量第三步进入cmd 并输入配置信息 git config global user name 用
pythonslice_shift_Pandas 解决dataframe的一列进行向下顺移问题

最近做比赛有时候需要造出新的特征而这次遇到的问题是将一列数据往下顺移一位同时将开头缺失的那一个数据用其他方式填充 df feature shift 1 向下顺移一位这时第一位会置为nan 需要填充历史分割线错误方案当时首先想到
pylucene分别安装在linux和windows（官方无Windows版的pylucene，要自编译）

pylucene 安装目前python很多包只支持32位不支持64位所以安装python尽量使用32位不要64位否则很多功能用不了参考文章 http blog csdn net orzli article details 124
python提取文件夹下所有jpg,Python提取转移文件夹内所有.jpg文件并查看每一帧的方法...

python里面可以将路径里面的替换成避免转义 os walk方法可以将目标路径下文件的root dirs files提取出来后面对每个文件进行操作切片操作判断是否为 jpg或 JPG文件 shutil的copy方法将文件从旧路径
Pytorch nn.Module模块详解

torch nn是专门为神经网络设计的模块化接口 nn构建于autograd之上可以用来定义和运行神经网络 nn Module是nn中十分重要的类包含网络各层的定义及forward方法如何定义自己的网络需要继承nn Module类

热门标签