param.grad为 None或者TypeError: unsupported operand type(s) for *: ‘float‘ and ‘NoneType‘

2023-10-27

在学习李沐的动手学深度学习，从零开始实现softmax回归中，我跟着敲完代码，发现无法运行，报错入如下：

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
Cell In[72], line 3
      1 num_epochs = 10
      2 print("000000000000000000000")
----> 3 train_ch3(net,train_iter,test_iter,cross_entropy,num_epochs,updater)

Cell In[71], line 6, in train_ch3(net, train_iter, test_iter, loss, num_epochs, updater)
      3 animator = Animator(xlabel = 'epoch',xlim=[1,num_epochs],ylim=[0.3,0.9],
      4                     legend=['train loss','train acc','test acc'])
      5 for epoch in range(num_epochs):
----> 6     train_metrics = train_epoch_ch3(net,train_iter,loss,updater)
      7     test_acc = evaluate_accuracy(net,test_iter)
      8     animator.add(epoch + 1,train_metrics + (test_acc,))

Cell In[69], line 21, in train_epoch_ch3(net, train_iter, loss, updater)
     19     print(X.shape[0])
     20     print("W.grad:",W.grad)
---> 21     updater(X.shape[0])
     22 metric.add(float(l.sum()),accuracy(y_hat,y),y.numel())
     23 #返回训练损失和训练精度

Cell In[67], line 3, in updater(batch_size)
      2 def updater(batch_size):
----> 3     return d2l.sgd([W,b],lr,batch_size)
...
    153 print("param.gram数据类型：")
--> 154 param.data.sub_(lr*param.grad/batch_size)
    155 param.grad.data.zero_()

TypeError: unsupported operand type(s) for *: 'float' and 'NoneType'

经过debug发现是param.grad（即W.grad)为None，即求梯度失败，反复看了代码，发现是在一开始W的定义中没有设置为求梯度，如下所示

W = torch.normal(0,0.01,size = (num_inputs, num_outputs))

加入计算梯度的参数后为：

W = torch.normal(0,0.01,size = (num_inputs, num_outputs)，require_grad = True)

最终问题得到解决，以后写代码一定认真点，因为这一个错误，debug了好久。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

人工智能

深度学习

Pytorch

param.grad为 None或者TypeError: unsupported operand type(s) for *: ‘float‘ and ‘NoneType‘ 的相关文章

如何在python中读取多个文件中的文本

我的文件夹中有许多文本文件大约有 3000 个文件每个文件中第 193 行是唯一包含重要信息的行我如何使用 python 将所有这些文件读入 1 个文本文件 os 模块中有一个名为 list dir 的函数该函数返回给定目录中所有文
如何在刻度标签和轴之间添加空间

我已成功增加刻度标签的字体但现在它们距离轴太近了我想在刻度标签和轴之间添加一点呼吸空间如果您不想全局更改间距通过编辑 rcParams 并且想要更简洁的方法请尝试以下操作 ax tick params axis both whic
如何使用固定的 pandas 数据框进行动态 matplotlib 绘图？

我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度我想找到一种方法以漂亮的动画风格绘制数据点以便它显示逐渐加载的所有点我知道有一个matplotlib animat
Flask 和 uWSGI - 无法加载应用程序 0 (mountpoint='')（找不到可调用或导入错误）

当我尝试使用 uWSGI 启动 Flask 时出现以下错误我是这样开始的 gt cd gt root localhost uwsgi socket 127 0 0 1 6000 file path to folder run py ca
更改自动插入 tkinter 小部件的文本颜色

我有一个文本框小部件其中插入了三条消息一条是开始消息一条是结束消息一条是在单位被摧毁时发出警报的消息我希望开始和结束消息是黑色的但被毁坏的消息参见我在代码中评论的位置插入小部件时颜色为红色我不太确定如何去做这件事我看
Python 多处理示例不起作用

我正在尝试学习如何使用multiprocessing但我无法让它发挥作用这是代码文档 http docs python org 2 library multiprocessing html from multiprocessing imp
pandas 替换多个值

以下是示例数据框 gt gt gt df pd DataFrame a 1 1 1 2 2 b 11 22 33 44 55 gt gt gt df a b 0 1 11 1 1 22 2 1 33 3 2 44 4 3 55 现在我想根据
打破嵌套循环[重复]

这个问题在这里已经有答案了有没有比抛出异常更简单的方法来打破嵌套循环在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签并且至少继续一个外循环 for x in range 10 fo
安装后 Anaconda 提示损坏

我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是安装后当我关闭提示窗口并打开新航站楼弹出
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
如何将 numpy.matrix 提高到非整数幂？

The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
在Python中重置生成器对象

我有一个由多个yield 返回的生成器对象准备调用该生成器是相当耗时的操作这就是为什么我想多次重复使用生成器 y FunctionWithYield for x in y print x here must be something t
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
用于运行可执行文件的python多线程进程

我正在尝试将一个在 Windows 上运行可执行文件并管理文本输出文件的 python 脚本升级到使用多线程进程的版本以便我可以利用多个核心我有四个独立版本的可执行文件每个线程都知道要访问它们这部分工作正常我遇到问题的地方是当它们
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
Python：元类属性有时会覆盖类属性？

下面代码的结果让我感到困惑 class MyClass type property def a self return 1 class MyObject object metaclass MyClass a 2 print MyObject
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9

随机推荐

3 个技巧教你轻松查看多开模拟器的端口号~

此文章来源于项目官方公众号 AirtestProject 版权声明允许转载但转载必须保留原链接请勿用作商业或者非法用途前言我们都知道连接模拟器设备的字符串里需要填上各个模拟器的端口号比如雷电模拟器的端口号为5554 auto
jsp简单页面计数器

在制作站点计数器时如果频繁的访问数数库比如象哪种每增加一人便写入数据库或文件的作法当你的站点有很大的访问量时必然会影响性能通常的做法有两种一是启动一个线程定时写入访问量二是先在内存中保存访问量只有当访问量达到一定的数量比
797. 所有可能的路径

797 所有可能的路径难度中等154 给你一个有 n 个节点的有向无环图 DAG 请你找出所有从节点 0 到节点 n 1 的路径并输出不要求按特定顺序二维数组的第 i 个数组中的单元都表示有向图中 i 号节点所能到达的下一些节点空
如何垂直居中一个浮动元素？

问题网址 http bbs daxiangclass com thread 163 htm 如何垂直居中一个浮动元素方法一已经知道元素高宽子盒子 div1 width 200px height 200px position absol
[Python]网络爬虫（十）：一个爬虫的诞生全过程（以山东大学绩点运算为例）...

先来说一下我们学校的网站 http jwxt sdu edu cn 7777 zhxt bks zhxt bks html 查询成绩需要登录然后显示各学科成绩但是只显示成绩而没有绩点也就是加权平均分显然这样手动计算绩点是一件非常麻烦
android studio 中JAVA文件提示android.support.v7.app.actionbaractivity is deprecated怎样处理?

出这个提示的地方有写解决办法呀 android support v7 app ActionBarActivity is deprecated use AppCompatActivity instead 意思是 ActionBarActivi
文档工程师

想做需求工程师不想做开发了行不行请给些意见悬赏 5 发布时间 2008 06 21 提问人 huihui2525 初级程序员本人从事软件开发工作1年多技术上一般般我是做j2ee的现在感觉越来越觉得不爱做开发了我本人性格比较
[429]python下安装mayavi

Mayavi基于Python作为VTK的载体在三维图像的渲染和交互操作方面具有很多优势最近分析数据的混沌的状态时需要在四维层面上表现数据的效果首先在matlab tecplot和origin试验了一番可以说他们都可以实现但在渲染效果
密码学知识点整理

序列流密码的特点加解密速度快无错误扩散分组块密码的特点应用模式灵活多样组内有错误扩散在传统观念里往往仅注重信息的秘密性但近代人们认为信息的真实性完整性以及不可否认性在应用上往往比秘密性更重要密钥的生命周期密
基于51单片机电子指南针设计程序+原理图+PCB+Proteus仿真+设计报告

功能介绍系统采用了磁阻 GMR 传感器采集某一方向磁场强度后通过MCU控制器对其进行处理并显示上传通过对电子指南针硬件电路和软件程序的分析阐述了电子指南针基本的工作原理及实现实际测试指南针模块精度达到1 能够在LCD上显示当前方位并
Python免费获取股票业绩预告【附源码】

在众多的股票量化策略里我比较钟爱一个策略净利润断层直观理解就是在股票的业绩预告业绩快报业绩报告等报告出来的时候因为业绩超预期股价会有一个跳空高开形成缺口而且因为上攻力量比较强这个缺口短期不会回补而且股价会随着上攻力量越来
vue-router 路由超详细教程

router 路由详细教程一前端路由的概念与原理 1 什么是路由 2 SPA与前端路由 3 什么是前端路由 4 前端路由的工作方式 5 实现简易的前端路由二 vue router的基本用法 1 什么是 vue router 2 vue
【Bus】编写一个Demo虚拟的总线-设备-驱动模型

文章目录 1 前言 2 总线驱动模型三要素 2 1 总线 2 2 设备 2 3 驱动 3 Demo Code 3 1 virt bus core c 3 2 virt device c 3 3 virt driver c 问题一 virt
BOF——Bag-of-Featrures

本文主要介绍 BOF Bag of Featrures 的原理及其应用 1 1 引言文档分类领域有一种模型称为词袋 Bag of words 模型它是自然语言处理与信息检索过程中的一种简化模型在这种模型中文本段落或文档被视为忽略
Docker之网络：容器通信的模式与技术

Docker的网络基础默认网络模式特殊的几种网络模式容器和宿主机的通信方式容器与外部主机的通信方式文章目录 Docker的网络基础一 Docker默认的原生网络 bridge桥接二 host模式三 none模式四 Dock
代码审计总结

目录概述一代码审计 1 1什么是代码审计 1 2为什么要执行代码审核 1 3代码审计的好处二代码审计流程 2 1代码检查方法 2 2代码检查项目 2 3编码规范 2 4代码检查规范 2 5缺陷检查表 2 6代码审计复查 2 7代码
Linux工具 Ansible

Linux工具 ansible Ansible是一个运维管理工具可以减少一些重复的配置比如有几百台主机需要进行相似的配置时或者对所有主机进行某些软件的版本升级时如果是人工一台一台的配置是非常慢的也容易出错毕竟人精力有限而这个An
PowerShell 美化（谁不想要一个好看的终端呢）

PowerShell 美化安装powershell Scoop 安装 Oh My Posh 安装字体设置应用主题花里胡哨的折腾 bushi 多种主题任君挑选安装powershell 地址 https github com Powe
neo4j官方示例数据库

官方示例数据库 CREATE TheMatrix Movie title The Matrix released 1999 tagline Welcome to the Real World CREATE Keanu Person name
param.grad为 None或者TypeError: unsupported operand type(s) for *: ‘float‘ and ‘NoneType‘

在学习李沐的动手学深度学习从零开始实现softmax回归中我跟着敲完代码发现无法运行报错入如下 TypeError Traceback most recent call last Cell In 72 line 3 1 num ep

param.grad为 None或者TypeError: unsupported operand type(s) for *: ‘float‘ and ‘NoneType‘

param.grad为 None或者TypeError: unsupported operand type(s) for *: ‘float‘ and ‘NoneType‘ 的相关文章

随机推荐

热门标签