为什么在 Pytorch 中，当我复制网络权重时，它会在反向传播后自动更新？

2023-12-10

我编写了以下代码作为测试，因为在我的原始网络中，我使用 ModuleDict 并取决于我提供的索引，它只会切片和训练该网络的一部分。

我想确保只有切片层会更新它们的权重，所以我编写了一些测试代码来仔细检查。好吧，我得到了一些奇怪的结果。假设我的模型有 2 层，第 1 层是 FC，第 2 层是 Conv2d，如果我对网络进行切片并且仅使用第 2 层，我会期望第 1 层的权重保持不变，因为它们未使用，第 2 层的权重将在 1 个周期后更新。

所以我的计划是使用for循环从网络中获取所有权重在训练之前我会在 1 之后执行optimizer.step()。这两次我都会将这些权重完全分开存储在 2 个 Python 列表中，以便稍后比较它们的结果。好吧，出于某种原因，如果我将它们与以下两个列表进行比较，它们是完全相同的torch.equal()我想这是因为也许内存中仍然存在某种隐藏的链接？所以我尝试使用.detach()当我从循环中抓住权重时，结果仍然相同。在这种情况下，第 2 层的权重应该有所不同，因为它应该包含训练前来自网络的权重。

在下面的代码中注意到我实际上使用了layer1并忽略了layer2。

完整代码：

class mymodel(nn.Module):
    def __init__(self):
        super().__init__() 
        self.layer1 = nn.Linear(10, 5)
        self.layer2 = nn.Conv2d(1, 5, 4, 2, 1)
        self.act = nn.Sigmoid()
    def forward(self, x):
        x = self.layer1(x) #only layer1 and act are used layer 2 is ignored so only layer1 and act's weight should be updated
        x = self.act(x)
        return x
model = mymodel()

weights = []

for param in model.parameters(): # loop the weights in the model before updating and store them
    print(param.size())
    weights.append(param)

critertion = nn.BCELoss() #criterion and optimizer setup
optimizer = optim.Adam(model.parameters(), lr = 0.001)

foo = torch.randn(3, 10) #fake input
target = torch.randn(3, 5) #fake target

result = model(foo) #predictions and comparison and backprop
loss = criterion(result, target)
optimizer.zero_grad()
loss.backward()
optimizer.step()


weights_after_backprop = [] # weights after backprop
for param in model.parameters():
    weights_after_backprop.append(param) # only layer1's weight should update, layer2 is not used

for i in zip(weights, weights_after_backprop):
    print(torch.equal(i[0], i[1]))

# **prints all Trues when "layer1" and "act" should be different, I have also tried to call param.detach in the loop but I got the same result.

你必须clone参数，否则您只需复制参考。

weights = []

for param in model.parameters():
    weights.append(param.clone())

criterion = nn.BCELoss() # criterion and optimizer setup
optimizer = optim.Adam(model.parameters(), lr=0.001)

foo = torch.randn(3, 10) # fake input
target = torch.randn(3, 5) # fake target

result = model(foo) # predictions and comparison and backprop
loss = criterion(result, target)
optimizer.zero_grad()
loss.backward()
optimizer.step()


weights_after_backprop = [] # weights after backprop
for param in model.parameters():
    weights_after_backprop.append(param.clone()) # only layer1's weight should update, layer2 is not used

for i in zip(weights, weights_after_backprop):
    print(torch.equal(i[0], i[1]))

这使

False
False
True
True

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么在 Pytorch 中，当我复制网络权重时，它会在反向传播后自动更新？的相关文章

Python 在 chroot 中运行时出现错误

我尝试在 chroot 中运行一些 Python 程序但出现以下错误 Could not find platform independent libraries
底图上的子图

我有一张英国地图和 121 个地点每个地点有 3 个值我想绘制 121 个位置中每个位置的三个值的小条形图目前这些值绘制为markersize属性看起来像这样密集恐惧症情节 https i stack imgur com 5fv
Python 遍历目录树的方法是什么？

我觉得分配文件和文件夹并执行 item 部分有点黑客有什么建议么我正在使用Python 3 2 from os import from os path import def dir contents path contents list
为什么在 Windows 中使用 GetConsoleScreenBufferInfoEx 时控制台窗口会缩小？

我正在尝试使用 GetConsoleScreenBufferInfoEx 和 SetConsoleScreenBufferInfoEx 设置 Windows 命令行控制台的背景和前景色我正在 Python 中使用 wintypes 进行此
将 API 数据存储到 DataFrame 中

我正在运行 Python 脚本来从 Interactive Brokers API 收集金融市场数据连接到API后终端打印出请求的历史数据如何将数据保存到数据帧中而不是在终端中流式传输 from ibapi wrapper impor
conda 无法从 yml 创建环境

我尝试运行下面的代码来从 YAML 文件创建虚拟 Python 环境我在 Ubuntu 服务器上的命令行中运行代码虚拟环境名为 py36 当我运行下面的代码时我收到下面的消息环境也没有被创建这个问题是因为我有几个必须使用 pip
如何从谷歌云存储桶读取音频文件并在datalab笔记本中使用ipd播放

我想在数据实验室笔记本中播放我从谷歌云存储桶中读取的声音文件这个怎么做 import numpy as np import IPython display as ipd import librosa import soundfile as
html 解析器 python

我正在尝试解析一个网站我正在使用 HTMLParser 模块问题是我想解析第一个 a href 评论后但我真的不知道该怎么做所以我在文档中发现有一个函数叫做handle comment 但我还没有找到如何正确使用它我有以下内容 i
如何找到列表S的所有分区为k个子集（可以为空）？

我有一个唯一元素列表比方说 1 2 我想将其拆分为 k 2 个子列表现在我想要所有可能的子列表 1 2 1 2 2 1 1 2 我想分成 1 1 2 我怎样才能用 Python 3 做到这一点更新我的目标是获取 N 个唯一数字列表的
Python 正则表达式部分匹配或“hitEnd”

我正在编写一个扫描器因此我将任意字符串与正则表达式规则列表进行匹配如果我可以模拟 Java hitEnd 功能不仅知道正则表达式何时不匹配还知道何时匹配这将非常有用 can t匹配当正则表达式匹配器在决定拒绝输入之前到达输入末尾
Django 的 URL 覆盖率测试为 0%，为什么？

使用姜戈鼻子我对 URL 进行了测试但 URL 覆盖率仍然为 0 为什么 python manage py 测试配置文件这是我的报道 Name Stmts Miss Cover Missing profiles 0 0 100 pro
如何修复错误“AttributeError：‘模块’对象在 python3 中没有属性‘客户端’？

以下是我的代码 import http h1 http client HTTPConnection www bing com 我认为没问题但是 python 给了我以下错误 AttributeError 模块对象没有属性客户端我想知
str.translate 给出 TypeError - Translate 采用一个参数（给定 2 个参数），在 Python 2 中工作

我有以下代码 import nltk os json csv string cPickle from scipy stats import scoreatpercentile lmtzr nltk stem wordnet WordNetL
Python 视频框架

我正在寻找一个 Python 框架它将使我能够播放视频并在该视频上绘图用于标记目的我尝试过 Pyglet 但这似乎效果不是特别好在现有视频上绘图时会出现闪烁即使使用双缓冲和所有这些好东西而且似乎没有办法在每帧回调期间获取视频中
求解不等式系统时“多项式错误：仅允许使用单变量多项式”

我想找到以下两个常数的区间cons1 and cons2我写了下面的代码 from sympy import Poly from sympy import Abs from sympy solvers inequalities import
Django 接受 AM/PM 作为表单输入

我试图弄清楚如何使用 DateTime 字段在 Django 中接受 am pm 作为时间格式但我遇到了一些麻烦我尝试在 forms py 文件中这样设置 pickup date time from DateTimeField inpu
大型数据集上的 Sklearn-GMM

我有一个很大的数据集我无法将整个数据放入内存中我想在这个数据集上拟合 GMM 我可以用吗GMM fit sklearn mixture GMM 重复小批量数据没有理由重复贴合只需随机采样您认为机器可以在合理时间内计算的尽可能多的数据
如何正确消除字典中的元素直到只剩下一个字符串

我真的需要这方面的帮助 def get winner dict winner new dict for winner in dict winner first letter winner 0 value dict winner winner
SQLAlchemy：避免声明式样式类定义中的重复

我正在使用 SQLAlchemy 并且我的对象模型中的许多类具有相同的两个属性 id 和整数和主键以及名称字符串我试图避免在每个类中声明它们如下所示 class C1 declarative base id Column Inte
如何使用Featuretools按列值从单个数据框中的多个列创建特征？

我正在尝试根据之前的结果来预测足球比赛的结果我在 Windows 上运行 Python 3 6 并使用 Featuretools 0 4 1 假设我有以下代表结果历史记录的数据框原始数据框 https i stack imgur com

随机推荐

删除数组内部的项目，该数组是字典 Swift 2 中的值

我知道以前可能已经回答过这个问题但是当我搜索时我找不到任何东西所以我有一本看起来像这样的字典 var dict String String 我想要做的是删除数组内的某个索引字典的值假设我想从此代码中删除字符串 Chair dict
结构体声明中的冒号是什么意思，例如：1、:7、:16 或:32？

下面的C 代码是什么意思 unsigned char a 1 unsigned char b 7 我猜它创建了两个字符 a 和 b 它们都应该是一个字节长但我不知道 1 和 7 部分的作用 1 和 7 是限制值范围的位大小它们通常出现在
打印第二个命令行参数

我正在编写一段代码来打印程序的第二个参数我明白那个ebp 8保存参数数量 ebp 12保存程序名称的地址等等到目前为止我有 include asm io inc SECTION data err1 db Incorrect number
与在 Dom4J 中使用 DOM 相比，XPath 的效率如何？

例如考虑以下 xml
“以管理员身份运行”和使用 requireAdministrator 的清单有什么区别？

我编写了一个程序其清单包含 requireAdministrator 在启用了 UAC 的 Windows 7 系统上 Windows 会弹出一个对话框询问权限这是理所当然的效果很好如果用户通过右键单击程序并选择以管理员身份运行
使用 sapply 时如何使用函数的参数？

我有一个通过列绑定创建的数据集cbindX函数从gdata包裹这个函数允许我绑定具有不同行数的列所以 NA当特定列中没有值时会引入现在我想计算每列的标准差我尝试使用 sapply dataset sd 这将返回包含所有行的值和的列
如何将 PDTextbox 的文本设置为颜色？

我想要一个 PDTextbox 有红色文本我可以写出红色文本并且可以设置文本框的值但我不确定如何将文本框内容设置为红色 ie if field instanceof PDTextbox field setValue field get
罗马数字转字符串中的数字

我有这个字符串 string Hello IV WorldX 我想将所有罗马数字替换为整数我有以下函数将罗马数字转换为整数 function roman2number roman conv array array letter gt I
如何在node和mongodb中查找？

这是我的用户组数据 id oid 58f7537ec422895572e988a1 name aaa groupname group north group south mobilenumber 0509867865 userid 60
如何使用 Android 从 Firebase 数据库更新特定节点？ [复制]

这个问题在这里已经有答案了我有一个相对简单的 Firebase 数据库如下所示我怎样才能更新Room1节点如果我使用此代码它不会更新节点而是添加另一个节点并使用新名称 Room2 databaseReference Fireb
检查文件是否已经存在于webview缓存android中

在我的应用程序中我有一个带有 webview 的活动它加载不同的图像在加载webview之前我需要知道图像是否已经缓存在webview缓存中我找到了适用于 2 3 Android 设备及更低版本的工作解决方案 String uri
在 CentOS 6.0 上安装 PyQt 4.9 失败

我完全厌倦了这个问题我正在尝试在运行 CentOS 6 0 的服务器上安装 PyQt 4 9 当我安装它时我得到这样的 root myserver PyQt python3 configure py k Determining the
根据“列”列表的内容对数据框进行子集化

Set Up 我有一个列表矩阵其中列之一是一个列表我意识到这是一个奇怪的数据集但我发现它对于其他操作很有用列表中的每个条目是 1 空 integer 0 2 整数或 3 整数向量例如 R 对象 d f 其中 d f ID 为
Eslint 禁止使用特定的环境变量

我有一个超级秘密变量SUPERBASE PRIVATE SERVICE ROLE我不希望我的开发人员在除特定位置之外的任何地方使用它我正在尝试使用这个规则 no restricted properties error object pro
将 Javascript 二维数组转换为 ArrayBuffer

我正在尝试使用Web Workers来处理大量数据并且当将数据传递回主线程进行显示时我想使用可传输对象来减少对UI线程的影响该过程当前会生成一个也可以包含对象的多维数组例如 foo bar Alice car 23 dab 2 3
如何将 ODBC 驱动程序添加到 MAMP 环境？

我正在开发使用 php 和 ms access 数据库在 PC 设置上构建的东西当我将应用程序移植到我的 MAMP 环境时我得到 Fatal error Call to undefined function odbc connect i
IPN 未发送，握手未验证。请检查您的信息。

我正在与 Paypal 上的 Expresscheckout 合作用于单次用户付款集成工作流程首先创建令牌用户重定向到 paypal 页面并成功到我的返回 URL 页面 1 设置快速结帐 2 DoExpressCheckout付款
Javascript：按数字属性对对象数组进行排序，其中包括未定义的属性

我可以定义一个数字数组并像这样对它们进行排序 var array 2 undefined 1 array sort a b gt a b console log array 输出是1 2 null 我有一个可以包含数字属性的对象数组我可以
用于从路径中提取文件名的正则表达式

我需要从以下路径中提取文件名无文件扩展名 my local server path to this file may contain any character pdf 我尝试过几件事大部分基于类似的事情http regexr com
为什么在 Pytorch 中，当我复制网络权重时，它会在反向传播后自动更新？

我编写了以下代码作为测试因为在我的原始网络中我使用 ModuleDict 并取决于我提供的索引它只会切片和训练该网络的一部分我想确保只有切片层会更新它们的权重所以我编写了一些测试代码来仔细检查好吧我得到了一些奇怪的结果假设我

为什么在 Pytorch 中，当我复制网络权重时，它会在反向传播后自动更新？

为什么在 Pytorch 中，当我复制网络权重时，它会在反向传播后自动更新？ 的相关文章

随机推荐

热门标签

为什么在 Pytorch 中，当我复制网络权重时，它会在反向传播后自动更新？的相关文章