Pytorch(六)(模型参数的遍历) —— model.parameters() & model.named_parameters() & model.state_dict()

2023-11-08

神经网络的模型参数

model.parameters(), model.named_parameters(), model.state_dict() 这三个方法都可以查看神经网络的参数信息，用于更新参数，或者用于模型的保存。作用都类似，写法略有出入

就以Pytorch之经典神经网络(一) —— 全连接网络(MNIST) 来举例 Pytorch之经典神经网络CNN(一) —— 全连接网络 / MLP (MNIST) (trainset和Dataloader & batch training & learning_rate)_hxxjxw的博客-CSDN博客
print(*[name for name, _ in self.model.named_parameters()], sep='\n')
print(*set([name.split('.')[0] for name, _ in self.named_parameters()]), sep='\n')
查看网络模型参数是否可训练
print(*[_.requires_grad for name, _ in model.named_parameters()], sep='\n')
model.named_parameters()

net.named_parameters()中param是len为2的tuple
param[0]是name，fc1.weight、fc1.bias等
param[1]是fc1.weight、fc1.bias等对应的值

一直是0，1，2，......, 这种序号
for _,param in enumerate(net.named_parameters()):
    print(param[0])
    print(param[1])
    print('----------------')
model.parameters()

net.parameters()中param就是fc1.weight、fc1.bias等对应的值，没带名字
for _,param in enumerate(net.parameters()):
    print(param)
    print('----------------')
model.state_dict()

net.state_dict() 中的param就只是str字符串 fc1.weight, fc1.bias等等

但它们可以作为参数来输出对应的值
for _,param in enumerate(net.state_dict()):
    print(param)
    print(net.state_dict()[param])
    print('----------------')

神经网络的各个层

当神经网络是这么定义的时候，即没有用nn.Sequential()

此时 print(net)

net = Net()
print(net)

输出单个的网络层

net = Net()
print(net.fc1)
print(net.fc2)
print(net.fc3)

输出各个网络层的weight，bias参数

net = Net()
print(net.fc1.weight)
print(net.fc1.bias)
print(net.fc2.weight)
print(net.fc2.bias)
print(net.fc3.weight)
print(net.fc3.bias)

当使用nn.Sequential定义的时候

import torch
import torchvision
from torchvision import transforms
from matplotlib import pyplot as plt
from torch import nn
from torch.nn import functional as F

from utils import plot_image,plot_curve,one_hot

# class Net(nn.Module):
#     def __init__(self):
#         super(Net, self).__init__()
#
#         #三层全连接层
#         #wx+b
#         self.fc1 = nn.Linear(28*28, 256)
#         self.fc2 = nn.Linear(256,64)
#         self.fc3 = nn.Linear(64,10)
#
#     def forward(self, x):
#         x = F.rule(self.fc1(x)) #F.relu和torch.relu，用哪个都行
#         x = F.relu(self.fc2(x))
#         x = F.relu(self.fc(3))
#
#         return x


class Net(nn.Module):

    def __init__(self):
        super(Net, self).__init__()

        self.fc = nn.Sequential(
            nn.Linear(28 * 28, 256),
            nn.ReLU(),
            nn.Linear(256, 64),
            nn.ReLU(),
            nn.Linear(64, 10)
        )

        def forward(self, x):
            # x: [b, 1, 28, 28]
            # h1 = relu(xw1+b1)
            x = self.fc(x)

            return x

batch_size = 512
#一次处理的图片的数量
#gpu一次可以处理并行多张图片

transform = transforms.Compose([
    torchvision.transforms.ToTensor(),
    torchvision.transforms.Normalize((0.1307,), (0.3081,))
])


trainset = torchvision.datasets.MNIST(
    root='dataset/',
    train=True,  #如果为True，从 training.pt 创建数据，否则从 test.pt 创建数据。
    download=True, #如果为true，则从 Internet 下载数据集并将其放在根目录中。 如果已下载数据集，则不会再次下载。
    transform=transform
)
#train=True表示是训练数据，train=False是测试数据

train_loader = torch.utils.data.DataLoader(
    dataset=trainset,
    batch_size=batch_size,
    shuffle=True  #在加载的时候将图片随机打散
)

testset = torchvision.datasets.MNIST(
    root='dataset/',
    train=False,
    download=True,
    transform=transform
)

train_loader = torch.utils.data.DataLoader(
    dataset=testset,
    batch_size=batch_size,
    shuffle=True
)

net = Net()
print(net.fc)
print(net.fc[0])
print(net.fc[1])
print(net.fc[2])
print(net.fc[3])
print(net.fc[4])
print(net.fc[0].weight)
print(net.fc[0].bias)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

神经网络

深度学习

Pytorch(六)(模型参数的遍历) —— model.parameters() & model.named_parameters() & model.state_dict() 的相关文章

复旦计算机学硕408,又一所院校专业课改投408——复旦大学

原标题又一所院校专业课改投408 复旦大学复旦大学简称复旦位于中国上海位列211工程 985工程入选双一流是一所综合性研究型的全国重点大学学校现有一级学科国家重点学科11个二级学科国家重点学科19个国家重点培育学科3
类的加载详解

到目前为止我们已经写了无数个类了但是具体它在Java虚拟机中到底是怎么实现的我们还从未探索过今天就带着大家一起初探一下jvm对类加载的过程目前博主技术水平有限以后随着技术的更加成熟会更新博客内容的也欢迎更多小伙伴持续关注和
Ubuntu10下SSH2协议安装

Ubuntu10下SSH2协议安装 SSH2是一套安全通讯协议框架早期的SSH1由于存在安全漏洞现在已经不用了基于SSH2协议的产品目前主要有openssh putty SSH Secure Shell Client等安装了SSH2
基础配置Tomcat及使用

配置Tomcat 背景简介目前很多网站由java编写所以解析Java程序需要有相关的软件来编写完成 Tomcat是其中之一 Tomcat技术先进性能稳定且免费是目前比较流行的web应用服务器 Tomcat是一个轻量化级应用服务器实
jaspersoft studio动态图片传输

业务需求简述在实际业务开发中需要动态生成PDF 其中包含客户签字图片技术栈 JasperReport Jaspersoft Studio软件动态图片传输流程 jaspersoft studio 拖入image到工作区选择最后一项点击
java爬取人人网数据

通过httpclient何httpparser两个类爬人人网中得数据其中的详细步骤以及文档下面详细介绍爬人人网相关代码 SuppressWarnings deprecation public class RenRen 输入用户名及密码
1.6 起步 - 初次运行 Git 前的配置

1 6 起步初次运行 Git 前的配置版本说明版本作者日期备注 0 1 loon 2019 3 19 初稿目录文章目录 1 6 起步初次运行 Git 前的配置版本说明目录初次运行 Git 前的配置 1 用户信息 2
怀旧服服务器荣誉系统是啥,魔兽世界怀旧服：荣誉系统要开了？大元帅吸引人，军衔要不要冲？...

魔兽世界怀旧服马上开荣誉系统了相信很多pvp玩家都会有冲军衔的目标因为军衔是实力和荣誉的象征有玩家清晰记得到了R13更新那天跟另外两个元帅法师一共3个元帅套站在铁炉堡银行门口围观的人超多那种自豪和成就感难以言喻大家知道大

随机推荐

echarts 饼图的指示线(labelline) 问题

数据过多且几个比较小的数据在一块扎堆 series name type pie center 25 50 radius 45 60 minAngle 10 设置每块扇形的最小占比 avoidLabelOverlap false hover
linux一次性创建多个文件/文件夹

1 创建多个文件 touch file 1 10 注创建10个文件文件名file0 file1 file10 2 创建多个目录 mkdir folder 1 10 注一次性创建10个文件夹目录名为folder1 folder2 fo
【Hive报错】Hive报错Expression Not In Group By Key解决方法

SQL例如以下会报错 select sum time as time roadCoding upstreamOrDownstream from historicalroaddata where 报以下roadcoding upstreamO
10个实用的Python数据可视化图表总结

可视化是一种方便的观察数据的方式可以一目了然地了解数据块我们经常使用柱状图直方图饼图箱图热图散点图线状图等这些典型的图对于数据可视化是必不可少的除了这些被广泛使用的图表外还有许多很好的却很少被使用的可视化方法这些图有
各向异性（anisotropic）浅提

文章目录各向异性 anisotropic 定义哪种物体具有各向异性反射什么导致各向异性反射总结各向异性 anisotropic 定义它指一种存在方向依赖性这意味着在不同的方向不同的特性相对于该属性各向同性当沿不同轴测量时
[Anaconda]——Linux下conda虚拟环境缺“msvcrt”

问题这里是在使用不同节点的系统时一个是普通的节点一个是GPU节点在普通节点下准备好了所有的环境使用Linux的NIS功能利用网络把硬盘挂载到不同的节点这个时候普通节点和GPU节点就做到了数据同步但是发现在使用conda虚拟环
ThinkPHP6 框架对接 ChatGPT应用

ThinkPHP6是一款优秀的PHP开发框架它提供了丰富的功能和易于使用的API 使得开发人员可以快速构建高质量的Web应用程序本文将介绍如何使用ThinkPHP6框架对接ChatGPT应用实现智能聊天机器人的功能首先我们需要在T
部署mac os渗透测试环境

一序言每次重装系统后配置环境都是需要耗费大量时间特此写一篇mac os部署渗透测试环境二过程一系统设置 1 常用设置 SSD 开启 TRIM 支持 sudo trimforce enable APP安装开启任何来源 sudo
Lua coroutine.create

Lua coroutine creat 相当于在C 中使用lua newthread Equivalent of Lua coroutine create in C using lua newthread 问题 I have a call
基于Qt的OpenGL编程（3.x以上GLSL可编程管线版）---(二十)面剔除

Vries的教程是我看过的最好的可编程管线OpenGL教程没有之一其原地址如下 https learnopengl cn github io 04 20Advanced 20OpenGL 04 20Face 20culling 关于面剔
# HTB-Tier2- Vaccine

HTB Tier2 Vaccine Web Network Vulnerability Assessment Databases Injection Custom Applications Protocols Source Code Ana
毕业设计基于Arduino的计算器

0 前言这两年开始毕业设计和毕业答辩的要求和难度不断提升传统的毕设题目缺少创新和亮点往往达不到毕业答辩的要求这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求为了大家能够顺利以及最少的精力通过毕设学长分享优质毕业设计项
暑期实训日志11——webstorm+chrome实时浏览插件

在网上看到一个webstorm chrome里JetBrains IDE Support能够实现实时浏览的小工具感觉非常实用一 JetBrains IDE Support下载下载地址直接从谷歌商店下载也可前提是进得去下载好后打开
sqli-labs(28-28a)

Less 28 1 测试http 127 0 0 1 sqli labs Less 28 id 1 27 页面回显不正常但又没有错误提示报错注入没戏尝试闭合语句加单引号回显不正常说明sql语句闭合至少有可能有判断有无在Les
log4cplus基础知识

一简介 log4cplus是C 编写的开源的日志系统具有线程安全灵活以及多粒度控制的特点通过将信息划分优先级使其可以面向程序调试运行测试和维护等全生命周期你可以选择将信息输出到屏幕文件 NT event log 甚至是远
SSM controller要能跳转页面又要能返回字符串

SpringMVC因为添加了下面这个bean 视图解析器当你方法返回的是 json 字符串等其它值时会404 跳转 jsp jsp页面
回文数的判断

文章目录题目一方案一二方案二三方案三四方案四题目判断一个整数是否是回文数回文数是指正序从左向右和倒序从右向左读都是一样的整数提示下面案例可供参考一方案一 public boolean palindro
二叉树深度优先搜索（DFS）、广度优先搜索（BFS）

深度优先搜索算法 Depth First Search DFS是搜索算法的一种它沿着树的深度遍历树的节点尽可能深的搜索树的分支当节点v的所有边都己被探寻过搜索将回溯到发现节点v的那条边的起始节点这一过程一直进行到已发现从源节点可达
pytorch Embedding模块，自动为文本加载预训练的embedding

pytorch 提供了一个简便方法torch nn Embedding from pretrained 可以将文本与预训练的embedding对应起来词 embedding word1 0 2 3 4 word2 1 2 3 4 word
Pytorch(六)(模型参数的遍历) —— model.parameters() & model.named_parameters() & model.state_dict()

神经网络的模型参数 model parameters model named parameters model state dict 这三个方法都可以查看神经网络的参数信息用于更新参数或者用于模型的保存作用都类似写法略有出入就以P

Pytorch(六)(模型参数的遍历) —— model.parameters() & model.named_parameters() & model.state_dict()

神经网络的模型参数

model.parameters(), model.named_parameters(), model.state_dict() 这三个方法都可以查看神经网络的参数信息，用于更新参数，或者用于模型的保存。作用都类似，写法略有出入

查看网络模型参数是否可训练

model.named_parameters()

model.parameters()

model.state_dict()

神经网络的各个层

输出单个的网络层

输出各个网络层的weight，bias参数

当使用nn.Sequential定义的时候

Pytorch(六)(模型参数的遍历) —— model.parameters() & model.named_parameters() & model.state_dict() 的相关文章

随机推荐

热门标签