在批次之间传递 LSTM 状态的最佳方式

2024-03-14

我正在尝试找到在批次之间传递 LSTM 状态的最佳方法。我已经搜索了所有内容，但找不到当前实施的解决方案。想象一下我有类似的东西：

cells = [rnn.LSTMCell(size) for size in [256,256]
cells = rnn.MultiRNNCell(cells, state_is_tuple=True)
init_state = cells.zero_state(tf.shape(x_hot)[0], dtype=tf.float32)
net, new_state = tf.nn.dynamic_rnn(cells, x_hot, initial_state=init_state ,dtype=tf.float32)

现在我想通过new_state在每个批次中有效，因此无需将其存储回内存，然后使用重新馈送到 tffeed_dict。更准确地说，我找到的所有解决方案都使用sess.run评估new_state and feed-dict将其传递到init_state。有没有什么办法可以做到这一点而没有使用瓶颈feed-dict?

我想我应该使用tf.assign在某种程度上，但文档不完整，我找不到任何解决方法。

我要感谢所有提前询问的人。

Cheers,

弗朗西斯科·萨维里奥

我在堆栈溢出上找到的所有其他答案都适用于旧版本或使用“feed-dict”方法来传递新状态。例如：

1) TensorFlow：记住下一批的 LSTM 状态（有状态 LSTM） https://stackoverflow.com/questions/38241410/tensorflow-remember-lstm-state-for-next-batch-stateful-lstm这是通过使用“feed-dict”来提供状态占位符来实现的，我想避免这种情况

2) Tensorflow - 批处理内的 LSTM 状态重用 https://stackoverflow.com/questions/42133661/tensorflow-lstm-state-reuse-within-batch这不适用于状态 tuple

3) 在 Tensorflow 中的运行之间保存 LSTM RNN 状态 https://stackoverflow.com/questions/41915056/saving-lstm-rnn-state-between-runs-in-tensorflow同样在这里

LSTMStateTuple无非是输出和隐藏状态的元组。tf.assign创建一个操作，在运行时将存储在张量中的值分配给变量（如果您有具体问题，请询问以便改进文档）。您可以使用该解决方案tf.assign通过使用从元组检索隐藏状态张量c元组的属性（假设您想要隐藏状态）-new_state.c

这是一个关于玩具问题的完整独立示例：https://gist.github.com/iganichev/632b425fed0263d0274ec5b922aa3b2f https://gist.github.com/iganichev/632b425fed0263d0274ec5b922aa3b2f

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在批次之间传递 LSTM 状态的最佳方式的相关文章

没有名为 crypto.cipher 的模块

我现在正在尝试加密一段时间我最近得到了这个基于 python 的密码器名为PythonCrypter https github com jbertman PythonCrypter 我对 Python 相当陌生当我尝试通过终端打开 C
在 python 程序中合并第三方库的最佳实践是什么？

下午好我正在为我的工作编写一个中小型Python程序该任务需要我使用 Excel 库xlwt and xlrd 以及一个用于查询 Oracle 数据库的库称为CX Oracle 我正在通过版本控制系统即CVS 开发该项目我想知道围
Python 的键盘中断不会中止 Rust 函数 (PyO3)

我有一个使用 PyO3 用 Rust 编写的 Python 库它涉及一些昂贵的计算单个函数调用最多需要 10 分钟从 Python 调用时如何中止执行 Ctrl C 好像只有执行结束后才会处理所以本质上没什么用最小可重现示例 Ca
SQLAlchemy 通过关联对象声明式多对多自连接

我有一个用户表和一个朋友表它将用户映射到其他用户因为每个用户可以有很多朋友这个关系显然是对称的如果用户A是用户B的朋友那么用户B也是用户A的朋友我只存储这个关系一次除了两个用户 ID 之外 Friends 表还有其他字段因此
如何使用Conda下载python包并随后离线安装？

我知道通过 pip 我可以使用以下命令下载 Python 包但 pip install 破坏了我的内部包依赖关系当我做 pip download
从字符串中删除识别的日期

作为输入我有几个包含不同格式日期的字符串例如彼得在16 45 我的生日是1990年7月8日 On 7 月 11 日星期六我会回家 I use dateutil parser parse识别字符串中的日期在下一步中我想从字符串中删除
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
Flask如何获取请求的HTTP_ORIGIN

我想用我自己设置的 Access Control Allow Origin 标头做出响应而弄清楚请求中的 HTTP ORIGIN 参数在哪里似乎很混乱我在用着烧瓶 0 10 1 以及HTTP ORIGIN似乎是这个的特点之一object
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
向 Altair 图表添加背景实心填充

I like Altair a lot for making graphs in Python As a tribute I wanted to regenerate the Economist graph s in Mistakes we
每个 X 具有多个 Y 值的 Python 散点图

我正在尝试使用 Python 创建一个散点图其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值如果每个 X 值的 Y 值的数量相同我可以使用以下代码使其工作 import numpy as np import mat
对年龄列进行分组/分类

我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
Rocket UniData/UniVerse：ODBC 无法分配足够的内存

每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate
如何使用 Pycharm 安装 tkinter？ [复制]

这个问题在这里已经有答案了 I used sudo apt get install python3 6 tk而且效果很好如果我在终端中打开 python Tkinter 就可以工作但我无法将其安装在我的 Pycharm 项目上 pip
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2
NotImplementedError：无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe

随机推荐

如何在 JSF 中关闭浏览器时使会话失效

任何人都可以帮助我在用户关闭浏览器时使会话无效每当用户关闭浏览器时 JSF 中的会话就会自动失效 Thanks 下面的链接可能会有所帮助浏览器窗口关闭事件 https stackoverflow com questions 163195
iOS 上的 Mobile Safari 在大页面上崩溃

我遇到一个问题当页面变得太大时使用 jQuery 加载和操作 DOM 时 Mobile Safari 会崩溃我在 iPhone 和 iPad 上都遇到同样的问题排除移动页面故障以查找错误的最佳方法是什么是否存在可能导致 Mobil
每次运行后，Xcode 6 都会在 iOS8 模拟器中不断重命名我的应用程序目录。

我正在运行 Xcode 6 Beta 5 但自从第一个 Beta 版以来这种情况就一直发生每次运行后我的应用程序在模拟器中的目录都会被重命名我花了一段时间才弄清楚这一点我用它来获取文档的目录引用 NSString folder NS
当我尝试卸载包含 NSSM 服务的软件时，失败

对于以下安装程序包我有服务XXXService当我安装我的包时成功安装并运行但卸载失败并出现错误并恢复我怀疑该服务仍在运行阻止删除main exe file 请帮助完成卸载工作重现此错误的完整最小源是可用的 https gith
将 R 与 php 连接

我正在尝试以 php localhost 方式运行 R 代码所以我按照这个例子 https www r bloggers com integrating php and r https www r bloggers com integra
GGPlot2 中的 NLS 回归，绘制 y=Ax^b 趋势线误差

我正在尝试在一组 3 个数据点上拟合基本幂趋势线就像您在 Excel 中模拟 y Ax b 函数一样我有一个非常简单的数据集加载到 LCurve data 中如下所示 MDPT 4 10 9 51 6 曲线下面积 287069 4 2
Matlab 中的分组箱线图：通用函数

在看到 SO 中这篇很棒的文章后 matlab绘制分组箱线图最有效的方法 https stackoverflow com questions 15971478 most efficient way of drawing grouped bo
更改 bootstrap vue 选项卡标题的标题颜色

I m using bootstrap vue js to create a tab The result is like this 我只想更改选项卡标题颜色因为它使用我项目中的默认颜色并来自 bootstrap vue js 官方链接
提交时避免 PHP 中的竞争条件：请不要多次单击“提交”！

不久前在线应用程序曾经说过不要多次点击提交现在已经消失了对吧例如在 PHP 中如何防范这种情况我使用的一个解决方案是在会话中放置一个变量这样您就不能每 10 秒多次提交到一个页面这样数据库工作就完成了因此可以进行正常检查
Automapper 地图自定义集合

Hello 我有一个看起来像这样的列表 public class PagedList
在 PHP 和 JavaScript 之间共享常量 [重复]

这个问题在这里已经有答案了可能的重复将 PHP 字符串传递给 Javascript 变量并转义换行符 https stackoverflow com questions 168214 pass a php string to a ja
确保立即选择 iframe

这可能是一个愚蠢的问题但是当我使用 iframe 时如果您单击该框架则可以使用特定方面由 iframe 使用的 html 文件中的事件侦听器控制如果您在 iframe 外部单击则会失去对这些控件和事件侦听器的访问权限有没有办法
PHP 重写 url 并保留发布的数据

我有一个 php 服务器我想重写传入的 url 由于传入请求是发布请求我还希望发布的数据在新的网址上传输我已经成功地使用以下重写规则重定向网址 RewriteRule test http localhost index php dat
Android：将 RGB888 转换为 Y800

我正在从 vuforia 获取作为 RGB888 bytes 捕获的图像我想将其传递给 zbar 它期望格式为 Y800 我怎样才能做到这一点 i tried Image barcode new Image width height RG
useReducer 的initialState 类型为never？

初始状态有错误类型为 email string 的参数密码字符串有效布尔值不可分配给 never 类型的参数 ts 2345 function reducer state IState action IFluxAction con
将 Selenium WebDriver 与 Tor 结合使用

因为 Tor Browser Bundle 只是 Firefox 的补丁版本所以似乎应该可以使用FirefoxDriver使用 Tor 浏览器这是我到目前为止所尝试过的 String torPath C Users My User De
类路径中的 Groovy 资源未加载

今天是个好日子我正在使用 spock 框架在我的 groovy 项目 IDE Intellij Idea 12 6 中进行测试我的 spock 规范类将文件名传递给 groovy 对象进行处理该文件肯定位于类路径中但是当我尝试以这种
如何用Java编写全屏模式？

我希望我的应用程序具有全屏模式最简单的方法是什么我是否需要第三方库来实现此目的或者 JDK 中是否已经提供了此功能 Try the 全屏独占模式API http java sun com docs books tutorial ext
即使我在组件中添加了提供程序，角度 2 中也没有响应提供程序？

错误这是我收到的错误即使我已将提供程序添加到我的组件中我无法获取我的错误是什么这是我的所有文件应用程序组件 ts 应用程序组件 html carservice ts 我无法解决 EXCEPTION Error in 0 0 ORI
在批次之间传递 LSTM 状态的最佳方式

我正在尝试找到在批次之间传递 LSTM 状态的最佳方法我已经搜索了所有内容但找不到当前实施的解决方案想象一下我有类似的东西 cells rnn LSTMCell size for size in 256 256 cells rnn M

在批次之间传递 LSTM 状态的最佳方式

在批次之间传递 LSTM 状态的最佳方式 的相关文章

随机推荐

热门标签

在批次之间传递 LSTM 状态的最佳方式的相关文章