为什么应该仅在 1 个元素张量上或使用变量的梯度来调用向后函数？

2023-12-21

我是 pytorch 的新手。我想了解为什么我们不能对包含大小为 [2,2] 的张量的变量调用后向函数。如果我们确实想在包含大小为 [2,2] 的张量的变量上调用它，我们必须首先定义一个梯度张量，然后在包含张量 w.r.t 定义的梯度的变量上调用后向函数。

从教程开始autograd

如果你想计算导数，你可以调用 .backward() 多变的。如果 Variable 是一个标量（即它保存一个元素数据），你不需要为backward()指定任何参数，但是如果它有更多元素，您需要指定一个 grad_output 参数，即匹配形状的张量。

基本上，要启动链式法则，您需要在输出处有一个梯度，才能使其运行。如果输出是标量损失函数（通常是这样 - 通常您在损失变量处开始向后传递），则其隐含值为 1.0

来自教程：

现在让我们 backprop out.backward() 相当于做 out.backward(torch.Tensor([1.0]))

但也许你只想更新一个子图（网络深处的某个地方）......以及 a 的值Variable是权重矩阵。然后你必须告诉它从哪里开始。来自他们的一位首席开发人员（链接中的某处）

对，那是正确的。我们只支持标量微分函数，所以如果你想向后开始形成一个非标量值你需要提供dout / dy

梯度参数

https://discuss.pytorch.org/t/how-the-backward-works-for-torch-variable/907/8 https://discuss.pytorch.org/t/how-the-backward-works-for-torch-variable/907/8好的解释

Pytorch，什么是梯度参数 https://stackoverflow.com/questions/43451125/pytorch-what-are-the-gradient-arguments很好的解释

http://pytorch.org/tutorials/beginner/blitz/autograd_tutorial.html http://pytorch.org/tutorials/beginner/blitz/autograd_tutorial.html教程

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Pytorch

为什么应该仅在 1 个元素张量上或使用变量的梯度来调用向后函数？的相关文章

如何恢复tensorflow inceptions检查点文件（ckpt）？

I have inception resnet v2 2016 08 30 ckpt文件是预先训练的初始模型我想使用恢复这个模型 saver restore sess ckpt filename 但为此我将需要编写训练该模型时使用的变量
在 Python 中解析 TCL 列表

我需要在双括号上拆分以空格分隔的 TCL 列表例如 OUTPUT 172 25 50 10 01 01 Ethernet 172 25 50 10 01 02 Ethernet Traffic Item 1 172 25 50 10 01
如何传递架构以从现有数据帧创建新数据帧？

要将 schema 传递到 json 文件我们这样做 from pyspark sql types import StructField StringType StructType IntegerType data schema Stru
让 VoiceChannel.members 和 Guild.members 返回完整列表的问题

每当我尝试使用 VoiceChannel members 或 Guild members 时它都不会提供适用成员的完整列表我从文本命令的上下文中获取 VoiceChannel 和 Guild 如下所示 bot command name
在 Python 中将列表元素作为单独的项目返回

Stackoverflow 的朋友们大家好我有一个计算列表的函数我想单独返回列表的每个元素如下所示接收此返回的函数旨在处理未定义数量的参数 def foo my list 1 2 3 4 return 1 2 3 4 列表中的元素数
在 Celery 任务中调用 Google Cloud API 永远不会返回

我正在尝试拨打外部电话Google Cloud Natural Language API从一个内Celery任务使用google cloud python包裹问题是对 API 的调用永远不会返回挂起 celery task def g
matplotlib 图中点的标签

所以这是一个关于已发布的解决方案的问题我试图在我拥有的 matplotlib 散点图中的点上放置一些数据标签我试图在这里模仿解决方案是否有与 MATLAB 的 datacursormode 等效的 matplotlib https s
MongoEngine 查询具有以列表中指定的前缀开头的属性的对象的列表

我需要在 Mongo 数据库中查询具有以列表中任何前缀开头的特定属性的元素现在我有一段这样的代码 query mymodel terms term in query terms 并且这会匹配在列表 term 上有一个项目的对象该列表中的
Python 内置的 super() 是否违反了 DRY？

显然这是有原因的但我没有足够的经验来认识到这一点这是Python中给出的例子docs http docs python org 2 library functions html super class C B def method se
为什么一旦我离开内置的运行服务器，Django 就无法找到我的管理媒体文件？

当我使用内置的简单服务器时一切正常管理界面很漂亮 python manage py runserver 但是当我尝试使用 wsgi 服务器为我的应用程序提供服务时django core handlers wsgi WSGIHandle
Python 3：将字符串转换为变量[重复]

这个问题在这里已经有答案了我正在从 txt 文件读取文本并且需要使用我读取的数据之一作为类实例的变量 class Sports def init self players 0 location name self players pla
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
未知错误：Chrome 无法启动：异常退出

当我使用 chromedriver 对 Selenium 运行测试时出现此错误 selenium common exceptions WebDriverException Message unknown error Chrome fail
通过Python连接到Bigquery：ProjectId和DatasetId必须非空

我编写了以下脚本来通过 SDK 将 Big Query 连接到 Python 如下所示 from google cloud import bigquery client bigquery Client project My First Pr
将 Matlab 的 datenum 格式转换为 Python

我刚刚开始从 Matlab 迁移到 Python 2 7 在读取 mat 文件时遇到一些问题时间信息以 Matlab 的日期数字格式存储对于那些不熟悉它的人日期序列号将日历日期表示为自固定基准日期以来已经过去的天数在 MATLAB
Protobuf 如何编码 oneof 消息结构

对于这个 python 程序在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
pytest找不到模块[重复]

这个问题在这里已经有答案了我正在关注pytest 良好实践 https docs pytest org en latest explanation goodpractices html test discovery或者至少我认为我是但是
python 对浮点数进行不正确的舍入

gt gt gt a 0 3135 gt gt gt print 3f a 0 314 gt gt gt a 0 3125 gt gt gt print 3f a 0 312 gt gt gt 我期待 0 313 而不是 0 312 有没有
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS
如何在Python脚本中从youtube-dl中提取文件大小？

我是 python 编程新手我想在下载之前提取视频音频大小任何 YouTube 视频 gt gt gt from youtube dl import YoutubeDL gt gt gt url https www youtube c

随机推荐

使用 Intel MKL 的 3D 卷积

我正在尝试使用 Intel 计算 3D 阵列的 3D 卷积MKL 有人可以给我一些提示吗是否可以使用实现MKL 提前致谢英特尔有他们页面上的示例 https software intel com en us node 4713903D
C# StreamReader，用于自定义分隔符的“ReadLine”

拥有该功能的最佳方式是什么StreamReader ReadLine 方法但带有自定义字符串分隔符我想做这样的事情 String text while text myStreamReader ReadUntil my delim n
如何使用提示（如简单的计算器）对数字求和？ [复制]

这个问题在这里已经有答案了我尝试使用 JavaScript 来做一件非常简单的事情一个百分比计算器这是代码 var num prompt What is the number var perc prompt What is the p
在 C# 中通过网络发送大文件的好方法？

我正在尝试构建一个应用程序该应用程序可以从网络中另一台计算机上运行的服务请求文件这些文件可能相当大有时 500mb 以上我正在考虑通过 TCP 发送它但我担心它可能需要将整个文件存储在内存中可能只有一个客户复制到共享目录也是不
反应本机地铁是节点模块中缺少路径

错误是这样的 Error Unable to resolve module metro src lib bundle modules HMRClient Here is additional error logs 当我必须创建一个新项目并运
捕获 dll 异常后访问冲突

我必须在运行时动态地将模块加载为 dll 因为它们事先并不知道只是它们符合类接口我注意到的是在我捕获 dll 抛出的异常在主线程的主程序中后会调用正确的析构函数并销毁模块并卸载 dll 但随后作为 catch 块末尾的当 V
如何将 thenAnswer 与返回 void 的方法一起使用

我想对以下方法进行单元测试 public void addRecord Record record Myclass newObj new Mycalss It creates newObj object set some values us
ORA-01000: 使用 Spring SimpleJDBCCall 时超出最大打开游标数

我们使用 Spring SimpleJdbcCall 来调用 Oracle 中返回游标的存储过程看起来 SimpleJdbcCall 没有关闭游标并且在一段时间后超出了最大打开游标数 ORA 01000 maximum open cur
bash 中的 stdout 重定向与使用 fprintf 写入 c 中的文件（速度）

我想知道哪个选项基本上更快我最感兴趣的是重定向机制我怀疑该文件是在程序启动时打开的 program gt file并在最后关闭因此每次程序输出一些内容时都应该将其写入文件就像听起来一样简单是这样吗那么我想这两种选择在速度方面
如何为 WCF REST C# 站点设置 oAuth 身份验证

我正在使用 VS 2010 在线模板的 WCF REST 服务模板 40 CS 制作一个网站它工作得很好但我需要保护它我需要支持 Windows Linux 和 iPhone 应用程序因此 REST oAuth 似乎是一个很好的解决
wp_list_comments() 不起作用

我从头开始创建了一个自定义主题没有什么花哨的简单主题我目前使用的是 WordPress 3 2 1 我把wp list comments 放在comments php中来列出评论它根本不起作用没有显示评论尝试将其放入 single
无法启动服务应用程序：OCI 运行时创建失败：container_linux.go:349

当我尝试使用 docker 启动 go 应用程序时遇到一些麻烦 ERROR for app Cannot start service app OCI runtime create failed container linux go 349
在 jquery 中使表行可点击，但表头不可点击

目前我正在使用 mytable tr click function blah blah 这使得所有行包括标题都可单击如何排除标题或 th s 使用将标题和正文分开 thead and tbody 标签并将选择器更改为 mytable
以编程方式找出谁对我们的 iPhone 应用程序给予了 5 星评级

我看到很多应用程序都说如果您给我们的应用程序评分 5 星您将获得 1000 个金币用户可以在下载的应用程序中使用这些硬币我想实现相同的功能我们如何以编程方式确定谁对我们的 iPhone 应用程序给予了 5 星评级以便我们可以在他
安装nodejs后未定义require

首先我从下载了node jslink https nodejs org en 然后我安装了browserifynpm install g browserify 然后我安装了fsnpm install fs 我收到以
将 FindBugs 配置从 Sonar 导入到 Maven

如何使用 Sonar 中的 FindBugs 配置文件作为规则集Maven FindBugs 插件 https gleclaire github io findbugs maven plugin 您可以放置您的文件即findbugs s
非常大且非常稀疏的非负矩阵分解

我有一个非常大且稀疏的矩阵 531K x 315K 单元格总数约为 1670 亿非零值仅为 1s 非零值总数约为 45K 有高效的 NMF 包来解决我的问题吗我知道有几个软件包可以实现这一点并且它们仅适用于小尺寸的数据矩阵任何想法都
WPF 将父绑定对象传递给转换器

我有 ItemsControl 绑定到 Student 类型的集合在 ItemTemplate 内部我有一个 TextBox 它使用 IValueConverter 来执行一些自定义计算和逻辑我想将实际的 Student 对象传递给值
如何使用jquery在加载时滑动整个页面

我想在更改时将整个页面向下滑动我想做到这一点的方法是创建一个垂直幻灯片在单击链接时播放并在页面加载时再次播放到目前为止我只能创建影响特定 DIV 的幻灯片我还希望它能够垂直滑入任何想法将不胜感激只需将所有内容包装在一个 di
为什么应该仅在 1 个元素张量上或使用变量的梯度来调用向后函数？

我是 pytorch 的新手我想了解为什么我们不能对包含大小为 2 2 的张量的变量调用后向函数如果我们确实想在包含大小为 2 2 的张量的变量上调用它我们必须首先定义一个梯度张量然后在包含张量 w r t 定义的梯度的变量上调用后

为什么应该仅在 1 个元素张量上或使用变量的梯度来调用向后函数？

为什么应该仅在 1 个元素张量上或使用变量的梯度来调用向后函数？ 的相关文章

随机推荐

热门标签

为什么应该仅在 1 个元素张量上或使用变量的梯度来调用向后函数？的相关文章