TensorFlow - 如何在忽略零权重的情况下计算梯度？

2024-01-13

我想通过将一些权重设置为 0.0（每层中的特定权重，以此处讨论不重要的方式选择）来实现剪枝，以（1）在推理过程中忽略它们，（2）在训练过程中忽略它们。

我知道我可以在推理过程中忽略它们，方法是对每一层应用一个掩码，其中 1 位于我想要保留的权重索引处，否则为零。

然而，在训练过程中，我希望忽略的权重继续被忽略。也就是说，我希望它们（1）不更新并且（2）不影响其余梯度的计算。

我可以通过在应用渐变之前屏蔽渐变来做到（1）。但我做不到（2）。

我尝试过这样的事情：

# Create an optimizer.
opt = GradientDescentOptimizer(learning_rate=0.1)

# Compute the gradients for a list of variables.
# This returns a list of tuples, each tuple containing gradients and
# the corresponding variable
[(var, grad)] = opt.compute_gradients(loss)

# Ask the optimizer to apply the capped gradients.
train_op = optimizer.apply_gradients([(grad * mask, var)])

但这并不能达到我的目的，因为optimizer.compute_gradients(loss)会计算损失基于所有权重，包括零权重。换句话说，grad将具有一些对应于权重为零的索引的梯度。应用掩模会“浪费”这些本应用于更新非零权重的梯度。

我希望它根据非零权重计算损失。

有任何想法吗？

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

Optimization

deeplearning

TensorFlow - 如何在忽略零权重的情况下计算梯度？的相关文章

从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
相当于 min() 的 rowMeans()

我在 R 邮件列表上多次看到这个问题但仍然找不到满意的答案假设我有一个矩阵m m lt matrix rnorm 10000000 ncol 10 我可以通过以下方式获得每行的平均值 system time rowMeans m use
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
如何从 R keras 中的类似生成器的数据中评估（）和预测（）

我有以下代码数据集可以下载here https www dropbox com s qjt5o31oyqj10m8 data tar gz dl 0 or here https www kaggle com c dogs vs cats
酸洗过程是确定性的吗？

对于特定的输入值 Pickle 是否总是产生相同的输出我想当腌制具有相同内容但不同插入删除历史记录的字典时可能会出现问题我的目标是使用 Pickle 和 SHA1 创建函数参数的签名以实现 memoize 我想当腌制具有相同内容但
如何将数组列表转换为 Spark 数据帧

假设我有一个列表 x 1 10 2 14 3 17 我想转换x具有两列的 Spark 数据框id 1 2 3 和value 10 14 17 我怎么能这么做呢 Thanks x 1 10 2 14 3 17 df sc paralleliz
如何将列表列表中的元素转换为小写？ [复制]

这个问题在这里已经有答案了我正在尝试将列表列表的元素转换为小写这就是看起来的样子 print dataset It went Through my shirt And came out The back and hit the kid
使用 SQLAlchemy 时出现“NoneType”对象没有属性“get”错误

我一直在尝试使用 SQLAlchemy 将对象映射到数据库但遇到了障碍 Edit Basically changed a whole bunch of stuff 版本信息如果方便的话操作系统 Mac OSX 10 5 8 Pytho
如何向 scikit-learn KD 树添加/删除数据点？

我想知道是否可以在创建 scikit learn KDTree 实例后添加或删除数据点例如 from sklearn neighbors import KDTree import numpy as np X np array 1 1 2
在python中实现COM接口类型库

我有一个插件我正在尝试为我工作的公司的应用程序创建一个示例我正在尝试用 Python 编写这个插件插件架构的工作方式是插件需要实现在提供的 COM 类型库中定义的接口因此它是该类型库的 COM 客户端并最终通过应用程序为其提供后
如何使用Python和h5py读取HDF5属性（元数据）

我有一个 HDF5 文件里面有多个文件夹每个文件夹都添加了属性有些将属性称为元数据我知道如何访问文件夹内的键但不知道如何使用 Python 提取属性h5py包裹以下是 HDFView 的属性 Folder1 800 4 Gro
Python str.format() 方法的默认 kwarg 值

我希望尝试使现有字符串的复数化尽可能简单并且想知道是否有可能得到str format 在查找 kwargs 时解释默认值这是一个例子 string number of sheep sheep has run away dict comp
Celery 任务分析

正如我所看到的top公用事业celery进程消耗大量CPU时间所以我想介绍一下它我可以在开发人员机器上手动执行此操作如下所示 python m cProfile o test date Y m d T prof manage py c
跨行对 Pandas 数据框进行分组 - 2.0

进一步这个问题跨行对 Pandas 数据框进行分组 https stackoverflow com questions 46995997 grouping pandas dataframe across rows 操作是 amount cl
使用 pythonbrew 编译 Python 3.2 和 2.7 时出现问题

我正在尝试使用构建多个版本的 python蟒蛇酿造 http pypi python org pypi pythonbrew 0 7 3 但我遇到了一些测试失败这是在运行的虚拟机上 Ubuntu 8 04 32 位当我使用时会发生这种情
Python 的键盘中断不会中止 Rust 函数 (PyO3)

我有一个使用 PyO3 用 Rust 编写的 Python 库它涉及一些昂贵的计算单个函数调用最多需要 10 分钟从 Python 调用时如何中止执行 Ctrl C 好像只有执行结束后才会处理所以本质上没什么用最小可重现示例 Ca
Django 管理员在模型编辑时间歇性返回 404

我们使用 Django Admin 来维护导出到我们的一些站点的一些数据有时当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时我们会得到 Django 404 页面模板它是偶尔发生的我们可以通过重新加载三次来重现它
SQLAlchemy 通过关联对象声明式多对多自连接

我有一个用户表和一个朋友表它将用户映射到其他用户因为每个用户可以有很多朋友这个关系显然是对称的如果用户A是用户B的朋友那么用户B也是用户A的朋友我只存储这个关系一次除了两个用户 ID 之外 Friends 表还有其他字段因此
如何在flask中使用g.user全局

据我了解 Flask 中的 g 变量它应该为我提供一个全局位置来存储数据例如登录后保存当前用户它是否正确我希望我的导航在登录后在整个网站上显示我的用户名我的观点包含 from Flask import g among other

随机推荐

通过插件覆盖 Visual Studio 语法突出显示？

这与我之前问过这个问题 https stackoverflow com questions 807404 displaying code sections with a different background color关于语法突出显示用
是否可以获得所有活动会话的列表？

当处于 Grails 操作中时我可以使用以下命令访问 HTTPSessionsession 是否还可以获得所有活动会话的列表这是评论中你的问题的答案我能够在 2 2 4 上使用它没有任何问题请务必阅读此内容blog http bu
AngularJS / 如何防止 IE 触发自动输入验证？

我有一些带有一些表格的页面每个表单都包含一些字段约束例如required和更多我只想在用户与验证错误交互时显示错误 UX gt 是确实只要领域 pristine意味着没有触摸不应该显示任何错误我设法用很多浏览器来实现这个要求
C/C++ 是一种语言还是两种语言？

C C 是一种语言还是两种语言我听说 C 就是带有类的 C 是对的吗 C http en wikipedia org wiki C 1982 1983 年与 C 分道扬镳这在计算机时代已经是很长一段时间了但是有许多与 C 兼容的 C
如何将目录结构导入 SVN，同时保持文件和文件夹修改日期相同？

我有一个大型源代码树 gt 2 GB WINCE 构建树我想开始使用 Subversion 进行管理到目前为止版本控制是通过保留树的多个副本并使用 Beyond Compare 来查找差异来管理的我发现使用 Subversion
如何在博客上创建或上传纯文本文件（如这两个 URL）？

如何在博客上创建或上传纯文本文件如这两个 URL crimlaw blogspot com Resume txt http crimlaw blogspot com Resume txt and crimlaw blogspot com
错误：光标'对象没有属性'_last_execulated

我有这个光标 cursor execute SELECT price FROM Items WHERE itemID SELECT item id FROM Purchases WHERE purchaseID d AND customer
如何以编程方式创建布局文件

我想知道是否可以动态创建一个 XML 布局文件来显示给用户这个想法是能够从中央服务器检索布局文件该文件可以显示这个动态的服务器驱动的 GUI XML 布局文件被打包为二进制文件并且膨胀也从二进制文件发生我不相信任意 XML 都可以
单击选项卡时返回 UINavigationController 堆栈的顶部？

我有一个UITabBarController有 4 个选项卡的界面每个选项卡都有一个UINavigationController 我怎样才能回到最上面UIViewController每一个UINavigationController每当按
搜索结果使用reactjs突出显示结果

我试图获得像 YouTube 这样的搜索结果只是尝试但我遇到了一些问题我已经在codesandbox中制作了工作应用程序here https codesandbox io s react codesandbox kyd4g 我有一个搜
DataBinding/WPF C# 的通用可观察字典类

我正在尝试在 C 中为 WPF DataBinding 创建一个可观察字典类我在这里找到了安迪的一个很好的例子 WPF 中字典的两种方式数据绑定 https stackoverflow com questions 800130 two w
如何使用 jQuery UI 日历/日期选择器显示周而不是日？

在过去的几个月里我一直在使用 jQuery UI 日历日期选择器并取得了巨大的成功我收到了一项新要求允许选择一周周日至周六而不是一天以前有人完成过这个吗按周而不是按天突出显示在文本框标签中显示开始日期和结束日期而不是单
在角度反应形式验证器中使用 google-libphonenumber

这是使用该库的基本用例我需要验证该号码是否有效我用的是有角度的反应形式 https angular io guide reactive forms 自定义验证器 https angular io guide form validatio
numpy loadtxt 跳过第一行

当我尝试使用 numpy 的 loadtxt 函数从 CSV 文件导入数据时遇到一个小问题这是我拥有的数据文件类型的示例将其命名为 datafile1 csv Comment 1 Comment 2 x y z 1 2 3 4 5 6
将异常类型添加到位框架已知异常

根据文档位框架中有一些已知的异常类型 https docs bit framework com docs bit server side web api html exceptions https docs bit framework c
修复 WooCommerce 中购物车最大优惠券折扣百分比

我在 woocommerce 中有一个优惠券代码 XYZ25 其中包含 25 的折扣最大折扣为 250 卢比如果用户应用优惠券代码 XYZ 25 获得 25 的折扣我如何限制用户获得不超过 250 卢比的折扣自 Woocommerc
ajax给出空白响应

我有一个 xml 内容存储在该位置 http localhost 8080 cleo primer rest elements search uid 1 query facebook
如何在 Eclipse RCP 中实现内容辅助的文档弹出窗口

我已经实现了自己的编辑器并为其添加了代码完成功能我的内容助理在源查看器配置中注册如下所示 public IContentAssistant getContentAssistant ISourceViewer sourceViewer i
谷歌云数据实验室和谷歌云人工智能平台笔记本有什么区别？

我正在研究建立端到端机器学习管道的最佳方法并评估数据探索组件选项我试图找出谷歌云数据实验室和谷歌云人工智能平台笔记本之间的区别它们似乎都提供类似的功能因此不确定它们为何存在或者其中一个是否是另一个的新迭代如果它们不同其中一种相
TensorFlow - 如何在忽略零权重的情况下计算梯度？

我想通过将一些权重设置为 0 0 每层中的特定权重以此处讨论不重要的方式选择来实现剪枝以 1 在推理过程中忽略它们 2 在训练过程中忽略它们我知道我可以在推理过程中忽略它们方法是对每一层应用一个掩码其中 1 位于我想要保留的权重

TensorFlow - 如何在忽略零权重的情况下计算梯度？

TensorFlow - 如何在忽略零权重的情况下计算梯度？ 的相关文章

随机推荐

热门标签

TensorFlow - 如何在忽略零权重的情况下计算梯度？的相关文章