Tensorflowdynamic_rnn参数含义

2024-01-23

我正在努力理解神秘的 RNN 文档。任何有关以下内容的帮助将不胜感激。

tf.nn.dynamic_rnn(cell, inputs, sequence_length=None, initial_state=None, dtype=None, parallel_iterations=None, swap_memory=False, time_major=False, scope=None)

我正在努力理解这些参数与数学 LSTM 方程和 RNN 定义的关系。单元格展开尺寸在哪里？它是由输入的“max_time”维度定义的吗？ batch_size只是为了方便分割长数据还是与小批量SGD有关？输出状态是否跨批次传递？

tf.nn.dynamic_rnn接受一批（具有小批量的含义）不相关的序列。

cell是您要使用的实际单元（LSTM、GRU，...）
inputs形状为batch_size x max_time x input_size其中 max_time 是最长序列中的步数（但所有序列可以具有相同的长度）
sequence_length是一个大小向量batch_size其中每个元素给出批次中每个序列的长度（如果所有序列的大小相同，则将其保留为默认值。该参数定义单元展开尺寸。

隐藏状态处理

处理隐藏状态的通常方法是在隐藏状态之前定义一个初始状态张量dynamic_rnn，例如这样：

hidden_state_in = cell.zero_state(batch_size, tf.float32) 
output, hidden_state_out = tf.nn.dynamic_rnn(cell, 
                                             inputs,
                                             initial_state=hidden_state_in,
                                             ...)

在上面的代码片段中，两个hidden_state_in and hidden_state_out具有相同的形状[batch_size, ...] (实际形状取决于您使用的单元格类型，但重要的是第一个维度是批量大小).

这边走，dynamic_rnn每个序列都有一个初始隐藏状态。它将在每个序列的时间步长之间传递隐藏状态inputs参数本身, and hidden_state_out将包含批次中每个序列的最终输出状态。同一批次的序列之间不会传递任何隐藏状态，而只会在同一序列的时间步之间传递。

什么时候需要手动反馈隐藏状态？

通常，当您进行训练时，每个批次都是无关的，因此您不必在执行训练时反馈隐藏状态session.run(output).

但是，如果您正在测试，并且需要每个时间步骤的输出（即您必须执行session.run()在每个时间步）您将需要使用如下所示的方法来评估并反馈输出隐藏状态：

output, hidden_state = sess.run([output, hidden_state_out],
                                feed_dict={hidden_state_in:hidden_state})

否则tensorflow将只使用默认值cell.zero_state(batch_size, tf.float32)在每个时间步，这相当于在每个时间步重新初始化隐藏状态。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

Tensorflowdynamic_rnn参数含义的相关文章

打印出网络架构中每一层的形状

在 Keras 中我们可以如下定义网络有什么办法可以输出每层之后的形状例如我想打印出以下形状inputs在定义行之后inputs 然后打印出形状conv1在定义行之后conv1 etc inputs Input 1 img rows
Tensorflow DecodeJPEG：预期图像（JPEG、PNG 或 GIF）以“\000\000\000\000\000\000\000\00”开头的格式未知

我正在循环浏览图像文件夹这种情况不断发生 tensorflow python framework errors impl InvalidArgumentError 预期的图像 JPEG PNG或GIF 以 000 000 000 000
无法从 DenseVariational 获得合理的结果

我正在尝试使用以下大小的数据集正弦曲线进行回归问题500 首先我尝试使用 2 个密集层每个层有 10 个单元 model tf keras Sequential tf keras layers Dense 10 activation
如何保存 Tensorflow.js 模型？

我想制作一个创建保存和训练 tensorflow js 模型的用户界面但我无法在创建模型后保存模型我什至从tensorflow js文档复制了这段代码但它不起作用 const model tf sequential layers t
张量流中有哪些资产？

我正在阅读有关保存和恢复模型的张量流教程并遇到以下声明 If assets need to be saved and written or copied to disk they can be provided when the firs
如何在对象检测 API Tensorflow 中仅检测人体

我在用tensorflow对象检测 API 用于检测对象它在我的 Windows 系统中运行良好我如何对其进行更改以仅检测提到的对象例如我只想检测人类而不是所有对象根据此中的第 1 条评论answer https stackove
在 Android 上保持 TensorFlow 模型加密

我搜索了解是否有一种技术可以在 Android 应用程序中保持经过训练的张量流模型 pb 文件的安全但没有找到任何有用的东西我正在发布一个包含我在训练集上构建的张量流模型的应用程序当我发布该应用程序时任何人都可以访问该模型并将其用
跨多个 GPU/机器的 TF-Slim 的配置/标志

我很好奇是否有关于如何使用部署 model deploy py 在多台机器上的多个 GPU 上运行 TF Slim models slim 的示例该文档非常好但我缺少一些内容具体来说需要为worker device和ps devic
从 [tensorflow 1.00] 中的 softmax 层提取概率

使用张量流我有一个 LSTM 分类模型以 softmax 作为最终节点这是我的 softmax 层 with tf name scope Softmax as scope with tf variable scope Softmax
使用输入管道时如何替换 feed_dict？

假设您有一个已与feed dict到目前为止将数据注入到图表中每隔几个时期我就会通过将任一数据集的一批数据输入到我的图表中来评估训练和测试损失现在出于性能原因我决定使用输入管道看看这个虚拟示例 import tensorflow
您必须使用 dtype float(Tensorflow) 为占位符张量“Placeholder”提供值

import tensorflow as tf import os import sklearn preprocessing import pandas as pd import numpy as np print os getcwd os
Tensorboard 和 Dropout 层

我有一个非常基本的查询我制作了 4 个几乎相同差异在于输入形状的 CNN 并在连接到全连接层的前馈网络时合并了它们几乎相同的 CNN 的代码 model3 Sequential model3 add Convolution2D 32
tf.gfile 在 TensorFlow 中起什么作用？

我见过人们使用以下几个函数tf gfile例如tf gfile GFile or tf gfile Exists 我有一个想法tf gfile处理文件但是我无法找到官方文档来了解它还提供了什么如果你能帮我的话那就太好了对于登陆这里的
AttributeError：模块“keras.engine”没有属性“Layer”

当我试图运行时Parking Slot mask rcnn py文件我收到如下错误mrcnn model py文件我该如何解决 gt 2021 06 17 08 25 18 585897 W tensorflow stream execut
使用 flow_from_dataframe y_col 的正确“值”是什么

我正在用 pandas 读取 csv 文件并给出存储在中的列名称colname colnames file label Read data from file data pd read csv Hand Annotations 2 csv
conv1D 中形状的尺寸

我尝试过构建一个只有一层的 CNN 但遇到了一些问题事实上编译器告诉我 ValueError 检查模型输入时出错预期的 conv1d 1 input 具有 3 个维度但得到形状为 569 30 的数组这是代码 import num
如何在 Tensorflow 中使用预训练的 Word2Vec 模型

我有一个Word2Vec训练过的模型Gensim 我如何使用它Tensorflow for Word Embeddings 我不想在 Tensorflow 中从头开始训练嵌入有人可以告诉我如何用一些示例代码来做到这一点吗假设您有一个字典
Tensorflow 到 ONNX 的转换

我目前正在尝试转换我使用本教程创建的已保存且正在工作的 pb 文件 https github com thtrieu darkflow https github com thtrieu darkflow 到 onnx 文件中我目前正在
ubuntu 20.04 上无法获取卷积算法错误~tensorflow-gpu

我有一个 NVIDIA 2070 RTX GPU 我的操作系统是 Ubuntu20 04 我已经使用 conda 安装了tensorflow gpu 包我有not安装了 CUDA toolkit 我相信它还会安装 CUDA toolkit
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为

随机推荐

GraphDB可视化图表不显示所有三元组

在我的图表中我有以下断言 prefix
CTP 4 更新后的 Visual Studio 2013（Cordova 模板）频繁崩溃

将 Visual Studio 2013 升级到 CTP4 并使用 Cordova 模板后每次单击保存并强制我重新启动时我的 Visual Studio 都会冻结使用 CTp3 多设备混合应用程序模板运行良好有人有同样的问题或解
使用 Swift 查找字符串中的第一个不重复字符

这会找到数组中的重复项但我正在寻找能够找到字符串中第一个非重复字符的东西我一直在试图找出一种方法来做到这一点但我无法弄清楚这是我得到的最接近的 var strArray P Q R S T P R A T B C P P P P P
MS Access 不需要的断点

我有一个复杂的 MS Access 2013 数据库其中包含数十个表单在其中一个表单上我有一个带有 vba 过程的按钮它从 MS SQL ADODB 返回值并将它们放入文本框中问题是每当我单击此按钮时它就会进入编译菜单就好像
FOSRestBundle + Symfony 3.4：无法识别其余类型

我正在使用带有 FOSUserBundle 的 Symfony 3 4 我已经从 Symfony 3 3 导入了我的项目现在出现错误无法确定由 api yaml 标识的控制器的类在 api yaml 中正在从 home user p
谷歌分析不适用于 iframe 中嵌入的网站

我的网站上运行谷歌分析 mydomain com 我不拥有的另一个网站 anotherdoamin com 将我的网站嵌入到其页面的 iframe 中我希望我的网站分析能够在 anotherdomain com 的 iframe 中工作
Android 设备可以充当 iBeacon 吗？

Android 设备能否充当 iBeacon 并确定其他 Android 设备何时进入其范围其他 Android 设备需要打开蓝牙吗如果顾客来到我的商店但他的设备上没有安装我的应用程序 iBeacon 可以工作吗还是必须先安装该应用
如何引用 TypeScript 文件而不遇到“require is not Defined”错误

我首先要说的是我不具备 TypeScript 或 JavaScript 的高级知识我做了什么我正在制作一个准系统 TypeScript 算法玩具盒它实现了来自算法基础布拉萨德和布拉特利我所做的是打开一个本地 HTML 文件然后转
缺少 3 个必需的位置参数 Python

是的我正在编写 python 代码并且收到此类型错误 TypeError printE 缺少 3 个必需的位置参数 emp2 emp3 和 emp4 for emmp in employee print printE emmp def
Tensorflow Inception FeedInputs：无法找到 feed 输出输入

我尝试了张量流网站中的初始教程 https www tensorflow org versions r0 12 how tos image retraining https www tensorflow org versions r0 12
如何让两个SQL查询真正异步

我的问题是基于一个真实的项目问题但我从未使用过System Threading Tasks库或执行任何涉及线程的严肃编程因此我的问题可能是缺乏有关特定库的知识以及对异步在编程方面的真正含义的更普遍的误解所以我的真实案例是这样的我需要
从 AppDelegate 调用委托函数不起作用

我试图在 AppDelegate 中调用委托函数但似乎它永远不会被调用 import UIKit UIApplicationMain class AppDelegate UIResponder UIApplicationDelegate
弹性搜索索引和关系数据库中的索引有什么区别？

似乎在弹性搜索中您将在集合上定义索引而在关系数据库中您将在列上定义索引如果整个集合都建立了索引为什么还需要定义它不幸的是索引一词在 ES 和关系数据库中的含义略有不同编辑非常因为它们针对不同的用例进行了优化数据库中的
Python UnicodeDecodeError：“utf8”编解码器无法解码字节...意外的代码字节

Python 新手构建他的第一个 Web 应用程序的旅程应用程序链接 http contractpy appspot com http contractpy appspot com 这只是一个实验性应用程序遵循a的建议堆栈溢出用户 ht
为什么从 ControllerBase 与 Controller for ASP.NET Core Web API 派生？

我正在按照本教程创建 ASP NET Core Web API 并且在添加控制器的部分中本教程提供了用于替换控制器模板代码的代码真正引起我注意的事情之一是在模板代码中我得到 TodoController Controller 然后在我
使用按钮打开另一个模块表单视图

我正在尝试打开另一个模型表单视图但收到错误外部 ID 未找到在 py文件中 class ru assignments models Model name ru assignments class ru assignments sub m
0022 和 022 之间的 umask 区别 [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案 umask 和 umask 有什么区别吗0022 and 022 我想将我的 umask 更改为022 我该怎么做 umask 没有区别0022和 u
如何在 Azure 移动服务部署上使用最新的 npm

我当前使用的 Azure 移动服务映像已锁定到 npm 版本 1 2 30 映像上安装了最新的 npm 版本位于 Program Files x86 npm 下但是 npm 被锁定到版本 1 2 30 因为它是与 node js 一起安
当我想要存储从下拉列表中选择或用户输入的值时，数据库设计的最佳实践是什么？

我正在尝试找到设计数据库的最佳方法以便允许出现以下情况向用户呈现大学的下拉列表例如用户从列表中选择他她的大学如果存在如果该大学不存在他应该在文本框中输入自己的大学有点像其他例如考虑到我可能想使用大学 ID 进行排序可
Tensorflowdynamic_rnn参数含义

我正在努力理解神秘的 RNN 文档任何有关以下内容的帮助将不胜感激 tf nn dynamic rnn cell inputs sequence length None initial state None dtype None para

热门标签