与 Tensorflow 中的常规 LSTMCell 相比，使用 CudnnLSTM 训练时的结果不同

2023-11-24

我正在 Python 中使用 Tensorflow 训练 LSTM 网络，并希望切换到 tf.contrib.cudnn_rnn.CudnnLSTM 以加快训练速度。我所做的被替换

cells = tf.nn.rnn_cell.LSTMCell(self.num_hidden) 
initial_state = cells.zero_state(self.batch_size, tf.float32)
rnn_outputs, _ = tf.nn.dynamic_rnn(cells, my_inputs, initial_state = initial_state)

with

lstm = tf.contrib.cudnn_rnn.CudnnLSTM(1, self.num_hidden)
rnn_outputs, _ = lstm(my_inputs)

我的训练速度显着提升（超过 10 倍），但同时我的性能指标却下降了。使用 LSTMCell 时，二元分类的 AUC 为 0.741，使用 CudnnLSTM 时，二元分类的 AUC 为 0.705。我想知道我是否做错了什么，或者这两者之间的实现存在差异，这就是如何在继续使用 CudnnLSTM 的同时恢复性能的情况。

训练数据集有 15,337 个不同长度的序列（最多几百个元素），这些序列用零填充，以便在每个批次中具有相同的长度。所有代码都是相同的，包括 TF 数据集 API 管道和所有评估指标。我运行了每个版本几次，并且在所有情况下它都收敛于这些值。

此外，我几乎没有可以插入完全相同模型的数据集，并且所有这些数据集都存在问题。

In the cudnn_rnn 的张量流代码我找到一句话说：

Cudnn LSTM 和 GRU 在数学上不同于它们的 tf 同行。

但没有解释这些差异到底是什么......

它似乎tf.contrib.cudnn_rnn.CudnnLSTM是时间主要的，所以应该提供形状的顺序(seq_len, batch_size, embedding_size)代替(batch_size, seq_len, embedding_size)，所以你必须转置它（我认为，当涉及到混乱的 Tensorflow 文档时无法确定，但你可能想测试一下。如果你想检查它，请参阅下面的链接）。

有关该主题的更多信息here（其中有另一个链接指向数学差异），除了一件事似乎是错误的：不仅 GRU 是时间主要的，LSTM 也是（如这个问题).

我会建议against using tf.contrib，因为它更加混乱（最终将被排除在 Tensorflow 2.0 版本之外）并坚持keras如果可能的话（因为它将是即将到来的主要前端张量流2.0) or tf.nn，因为它将成为tf.EstimatorAPI（尽管在我看来它的可读性要差得多）。

...或者考虑使用 PyTorch 来省去麻烦，至少在文档中提供了输入形状（及其含义）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

与 Tensorflow 中的常规 LSTMCell 相比，使用 CudnnLSTM 训练时的结果不同的相关文章

Python：记录垃圾收集器

我有一个 python 应用程序有一些性能问题我想将垃圾收集器的事件特别是何时调用添加到我的日志中是否可以 thanks http docs python org library gc html gc set debug http
子进程改变目录

我想在子目录超级目录中执行脚本我需要首先进入该子目录超级目录我无法得到subprocess进入我的子目录 tducin localhost Projekty tests ve python Python 2 7 4 default
Python 中的安全解除引用

Groovy 有一个很好的安全取消引用运算符这有助于避免 NullPointerExceptions variable method The method仅当以下情况时才会被调用variable is not null 有没有办法在 Py
为什么在 Windows 中使用 GetConsoleScreenBufferInfoEx 时控制台窗口会缩小？

我正在尝试使用 GetConsoleScreenBufferInfoEx 和 SetConsoleScreenBufferInfoEx 设置 Windows 命令行控制台的背景和前景色我正在 Python 中使用 wintypes 进行此
conda 无法从 yml 创建环境

我尝试运行下面的代码来从 YAML 文件创建虚拟 Python 环境我在 Ubuntu 服务器上的命令行中运行代码虚拟环境名为 py36 当我运行下面的代码时我收到下面的消息环境也没有被创建这个问题是因为我有几个必须使用 pip
如何找到列表S的所有分区为k个子集（可以为空）？

我有一个唯一元素列表比方说 1 2 我想将其拆分为 k 2 个子列表现在我想要所有可能的子列表 1 2 1 2 2 1 1 2 我想分成 1 1 2 我怎样才能用 Python 3 做到这一点更新我的目标是获取 N 个唯一数字列表的
Django 的 URL 覆盖率测试为 0%，为什么？

使用姜戈鼻子我对 URL 进行了测试但 URL 覆盖率仍然为 0 为什么 python manage py 测试配置文件这是我的报道 Name Stmts Miss Cover Missing profiles 0 0 100 pro
用Python中的嵌套for循环替换重复的if语句？

在我编写的下面的代码中 n 4 所以有五个 if 语句所以如果我想将 n 增加到比如说 10 那么就会有很多 if 语句因此我的问题是如何用更优雅的东西替换所有 if 语句 n p 4 5 number of trials prob
如何在对象检测 API 中同时训练和评估？

我想同时在我自己的数据集上训练评估 ssd mobilenet v1 cocoObject Detection API 然而当我尝试这样做时我面临着 GPU 内存几乎已满因此评估脚本无法启动以下是我用于训练和评估的命令在一个终端
如何修复错误“AttributeError：‘模块’对象在 python3 中没有属性‘客户端’？

以下是我的代码 import http h1 http client HTTPConnection www bing com 我认为没问题但是 python 给了我以下错误 AttributeError 模块对象没有属性客户端我想知
str.translate 给出 TypeError - Translate 采用一个参数（给定 2 个参数），在 Python 2 中工作

我有以下代码 import nltk os json csv string cPickle from scipy stats import scoreatpercentile lmtzr nltk stem wordnet WordNetL
一行Python和SQLite代码，为什么需要加“，”？ [复制]

这个问题在这里已经有答案了 c execute INSERT INTO numbers VALUES random randint 0 100 如果我将上面的代码更改为 c execute INSERT INTO numbers VALUE
在Python中删除带有重音符号的字符串中的所有非字母字符

我正在尝试使用 Python 3 7 从包含重音符号的字符串中删除所有非字母字符空格除外我尝试了以下方法 import re text 29 1981 4 2008 clean text re sub W d text print cl
如何使用 PySpark 有效地将这么多 csv 文件（大约 130,000 个）合并到一个大型数据集中？

我之前发布了这个问题并得到了一些使用 PySpark 的建议如何有效地将这一大数据集合并到一个大数据框中 https stackoverflow com questions 60259271 how can i merge this la
在 matplotlib 中使用 yscale('log') 时缺少误差线

在某些情况下当使用对数刻度时 matplotlib 会错误地显示带有误差条的图假设这些数据例如在 pylab 内 s 19 0 20 0 21 0 22 0 24 0 v 36 5 66 814250000000001 130 177
pip 安装软件包两次

不幸的是我无法重现它但我们已经见过几次了 pip 将一个软件包安装两次如果卸载第一个第二个就会可见并且也可以被卸载我的问题如果一个包安装了两次如何用 python 检查背景我想编写一个测试来检查这一点 devOp Updat
参数验证，Python 中的最佳实践[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案让我们举一个 API 的例子 def get abs directory self path if os path isdir path ret
如何检查列表是否为空？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动例如如果通过以下内容 a 我如何检查是否a是空的 if not a print Lis
Spyder 如何在同一线程的后台运行 asyncio 事件循环（或者确实如此？）

我已经研究 asyncio 模块功能几天了因为我想将它用于我的应用程序的 IO 绑定部分并且我认为我现在对它的工作原理有一个合理的理解或者在至少我认为我已经理解了以下内容任一时刻任一线程中只能运行一个异步事件循环一旦一切都设置
如何正确消除字典中的元素直到只剩下一个字符串

我真的需要这方面的帮助 def get winner dict winner new dict for winner in dict winner first letter winner 0 value dict winner winner

随机推荐

如何使 JXTreeTable 对其顶部元素进行排序

我知道我已经查看了来源 JXTreeTable 上的排序已被禁用但是我希望允许仅根据根节点的直接子节点的值对所有列进行排序假设我有这样的结构 Name Date File UID Root Mr X 1996 10 22 AE123
rspec 和 Shoulda - 互补还是替代？

我已经使用shoulda有一段时间了并且我已经阅读并使用了rspec 我没有做过深入的比较和对比但在我看来两者之间有一些重叠但它们并不是一对一的替代我正在考虑使用 rspec 在我的 Rails 系统中编写一些单元测试而不替换用
Django ORM：覆盖子类中字段的 related_name

我得到这个异常 django core exceptions FieldError 类 SpecialPlugin 中的本地字段 ticket 与基类 BasePlugin 中名称相似的字段发生冲突这是我的模型 class BasePlu
点击屏幕顶部状态栏时 UITableView 滚动到顶部

我插入了一个UITableView在另一个里面UIViewController的观点但是当我点击屏幕顶部的状态栏时表视图不会滚动到顶部这是 iOS 应用程序中的预期行为我试过 self tableView setScrollsToT
更改实例变量

我有这个代码 class Yes def init self self a 1 def yes self if self a 1 print Yes else print No but yes class No Yes def no sel
控制android状态栏图标

我正在尝试对状态栏中图标的状态进行一些控制我希望能够执行以下操作保留图标在状态栏中可见只要当应用程序运行时即使用户选择清除状态栏清除状态栏中的图标如果应用程序退出即使特别是它被杀死我意识到当应用程序显式退出时我可以将
将 Relay 与 React-Native 结合使用时的条件片段或嵌入式根容器

我有relay与一起工作react native 但我对如何最好地利用中继路由和根容器感到困惑特别是在使用Navigator呈现多条路线参加以下课程 var Nav React createClass renderScene rout
测试用例和断言语句

代码在这个问题让我思考 assert value gt 0 Precondition if value gt 0 Doit 我从不写 if 语句断言就足够了你全部can做早早崩溃经常崩溃代码完成 states 断言语句使应用程序正
以下位操作的优化机会？

您认为 haswon 函数还有优化的空间吗见下文我认识到将参数类型从 int64 to unsigned int64使该功能比我想象的更快也许还有优化的机会更详细地说我正在写一个连接四个游戏最近我使用了Profiler很困并认识
如何在 Visual Studio 2008 中自定义复制/粘贴行为？

如何在 Visual Studio 2008 中自定义复制粘贴行为例如我创建一个新的 div div 然后将其复制并粘贴到同一个文件中 VisualStudio 粘贴 div div 而不是我复制的原文更令人沮丧的是当我尝试复制一组
通过 Javascript 访问 Google Apps 公共电子表格

花了很多时间看这个似乎有关访问 Google apps 电子表格的少量信息维护得不是很好今年的 Google IO 上宣布了增强的 Google apps 脚本包括 UI 元素这让我想到创建一个基于 Google 电子表格中的数据的
在 MVC 操作中将 SSRS 报告导出为 PDF

是的我想将 SSRS 报告导出为 PDF 并从我的操作中返回它我没有任何报告查看器请建议我如何实现这一目标到目前为止我已经做到了 public void SqlServerReport NetworkCredential nwc n
指针和数组混淆的 K&R Qsort 示例

我发现很难理解下面的代码片段我理解所显示的指向函数风格的指针但我发现混乱之处在于指示的行中 void qsort void v int left int right int comp void void int i last void
带有数字填充的 CSS 计数器 [重复]

这个问题在这里已经有答案了可以垫吗counter数字取决于其价值 div counter reset ruler div gt span display block line height 1rem div gt span before
在VS2022中的wsl2中调试控制台时读取输入

我在 Visual Studio 2022 中创建了一个控制台应用程序只有两行 WriteLine 和 ReadLine 在 Windows 上调试它时会打开一个控制台显示输出并等待输入但是如果我将其切换到 WSL 调试我会在
Java：ArrayList如何管理内存

在我的数据结构课程中我们研究了 Java ArrayList 类以及当用户添加更多元素时它如何增长底层数组这是可以理解的但是我无法弄清楚当从列表中删除大量元素时此类到底如何释放内存查看源码删除元素的方法有3种 public
如何指定退出或中止的方法

我有一个从 CLI 触发的方法该方法具有一些显式退出或中止的逻辑路径我发现在为此方法编写规范时 RSpec 将其标记为失败因为退出是异常这是一个简单的例子 def cli method if condition puts Ever
如何使用 sox 合并多个音频文件

我使用以下命令通过 sox 将两个音频文件合并为一个 sox end mp3 p pad 6 0 sox m start mp3 output mp3 我想知道如何仅使用一个命令来合并 3 或 4 个音频文件而不是使用 output mp
#java.lang.NoClassDefFoundError: org/apache/commons/digester/Digester

我正进入状态java lang NoClassDefFoundError org apache commons digester Digester错误我被这个错误困扰了一个多月我已经尝试了所有可用的 Digester 版本并且还检查
与 Tensorflow 中的常规 LSTMCell 相比，使用 CudnnLSTM 训练时的结果不同

我正在 Python 中使用 Tensorflow 训练 LSTM 网络并希望切换到 tf contrib cudnn rnn CudnnLSTM 以加快训练速度我所做的被替换 cells tf nn rnn cell LSTMCell

与 Tensorflow 中的常规 LSTMCell 相比，使用 CudnnLSTM 训练时的结果不同

与 Tensorflow 中的常规 LSTMCell 相比，使用 CudnnLSTM 训练时的结果不同 的相关文章

随机推荐

热门标签

与 Tensorflow 中的常规 LSTMCell 相比，使用 CudnnLSTM 训练时的结果不同的相关文章