tensorflow中control_flow_ops.while_loop

2023-05-16

self.h0 = tf.zeros([self.batch_size, self.hidden_dim])
self.h0 = tf.stack([self.h0, self.h0])  ## 相当于 h0和C0

 # generator on initial randomness 
 gen_o = tensor_array_ops.TensorArray(dtype=tf.float32, size=self.sequence_length, dynamic_size=False, infer_shape=True)
 gen_x = tensor_array_ops.TensorArray(dtype=tf.int32, size=self.sequence_length, dynamic_size=False, infer_shape=True)

 def _g_recurrence(i, x_t, h_tm1, gen_o, gen_x): 
     h_t = self.g_recurrent_unit(x_t, h_tm1)  # hidden_memory_tuple, h_t其实包含h_t和c_t, tm1即是t减去1
     o_t = self.g_output_unit(h_t)  # batch x vocab , logits
     log_prob = tf.log(tf.nn.softmax(o_t)) 
     next_token = tf.cast(tf.reshape(tf.multinomial(log_prob, 1), [self.batch_size]), tf.int32) ## next_token的shape是[batch]
     x_tp1 = tf.nn.embedding_lookup(self.g_embeddings, next_token)  # batch x emb_dim
     gen_o = gen_o.write(i, tf.reduce_sum(tf.multiply(tf.one_hot(next_token, self.num_emb, 1.0, 0.0), tf.nn.softmax(o_t)), 1))
     gen_x = gen_x.write(i, next_token)  # indices, batch_size
     return i + 1, x_tp1, h_t, gen_o, gen_x  ## x_tp1其实就是p就是Plus

 _, _, _, self.gen_o, self.gen_x = control_flow_ops.while_loop(
     cond=lambda i, _1, _2, _3, _4: i < self.sequence_length, ## cond的值要么为True或者为False 
     body=_g_recurrence,
     loop_vars=(tf.constant(0, dtype=tf.int32), tf.nn.embedding_lookup(self.g_embeddings, self.start_token), self.h0, gen_o, gen_x)  
     )

这段代码出自文章《SeqGAN:Sequence Generative Adversarial Nets with Policy Gradient》源码模块target_lstm.py中，我其实是不太明白control_flow_ops.while_loop的用法，琢磨后为避免忘记特记录在此。

代码是 1 、 2 行 : \color{red}{代码是1、2行:} 代码是1、2行:
lstm或gru执行的初始状态

代码第 6 行： \color{red}{代码第6行：} 代码第6行：
gen_x = tensor_array_ops.TensorArray(dtype=tf.int32, size=self.sequence_length, dynamic_size=False, infer_shape=True)
TensorArray可以看做是具有动态size功能的Tensor数组。通常都是跟while_loop或map_fn结合使用。
我是不是可以理解成一个list，在代码第15行的时候即是将新生成的next_token写入到gen_x中
代码第 15 行： \color{red}{代码第15行：} 代码第15行：
gen_x = gen_x.write(i, next_token)
指定index位置写入Tensor, 我觉得write就类似与python中list的append方法，将生成的next_token存储到gen_x中
代码第 19 行： \color{red}{代码第19行：} 代码第19行：
cond=lambda i, _1, _2, _3, _4: i < self.sequence_length
这行代码是while_loop执行的条件，如果 i < self.sequence_length条件满足, 则cond=True, 执行control_flow_ops.while_loop这个循环，再看lambda表达式，其可以有任意多个形参，在这个表达式里有五个，分别是 i, _1, _2, _3, _4, 为什么是五个参数呢？这里暂且不说（问题1）

代码第 20 行： \color{red}{代码第20行：} 代码第20行：
body=_g_recurrence
循环主体，_g_recurrence函数已经定义（第8行到第16行），这个函数需要传入5个参数，所以在cand这个条件中需要定义5个形参（问题1的答案），如果cand = True, 就一直执行body，需要注意一点的，每次执行_g_recurrence这个body时参数的参数是不同的，是上一步执行的结果作为本次传入的参数

代码第 21 行： \color{red}{代码第21行：} 代码第21行：
loop_vars=(tf.constant(0, dtype=tf.int32), tf.nn.embedding_lookup(self.g_embeddings, self.start_token), self.h0, gen_o, gen_x)
loop_vars是循环起始参数，这五个是实参，对应与cand中五个形参

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow中control_flow_ops.while_loop 的相关文章

在NN中指定连接（在keras中）

我正在使用 keras 和tensorflow 1 4 我想明确指定哪些神经元在两层之间连接因此每当第一层中的神经元 i 连接到第二层中的神经元 j 且其他地方为零时我就有一个矩阵 A 其中包含 1 我的第一次尝试是创建一个带有内核的
TensorFlow.js 调整 3D 张量大小

我有一个具有以下尺寸的 3D 张量宽度 x 高度 x 深度我需要将可变大小的体积调整为特定形状例如 256 x 256 x 256 不幸的是在 TensorFlow js 中他们有一组用于调整大小的方法例如tf image re
“Dense”对象没有属性“op”[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我正在尝试使用tensorflow keras制作一个完全连接的模型这是我的代码 from tensorflow keras m
Tensorflow DecodeJPEG：预期图像（JPEG、PNG 或 GIF）以“\000\000\000\000\000\000\000\00”开头的格式未知

我正在循环浏览图像文件夹这种情况不断发生 tensorflow python framework errors impl InvalidArgumentError 预期的图像 JPEG PNG或GIF 以 000 000 000 000
张量流如何处理复杂的梯度？

Let z是一个复变量 C z 是它的共轭在复分析理论中导数C z w r t z不存在但在张量流中我们可以计算dC z dz结果就是1 这是一个例子 x tf placeholder complex64 2 2 y tf redu
TensorFlow CUDA_ERROR_OUT_OF_MEMORY

我正在尝试在 TensorFlow 中构建一个大型 CNN 并打算在多 GPU 系统上运行它我采用了塔式系统并为两个 GPU 拆分批次同时将变量和其他计算保留在 CPU 上我的系统有 32GB 内存但是当我运行代码时出现错误
张量流中有哪些资产？

我正在阅读有关保存和恢复模型的张量流教程并遇到以下声明 If assets need to be saved and written or copied to disk they can be provided when the firs
在 keras 中使用条件实现自定义损失函数

我需要一些有关 keras 损失函数的帮助我一直在使用 Tensorflow 后端在 keras 上实现自定义损失函数我已经在 numpy 中实现了自定义损失函数但如果它可以转换为 keras 损失函数那就太好了损失函数采用数据帧
keras LSTM 以正确的形状提供输入

我从具有以下形状的 pandas 数据框中获取一些数据 df head gt gt gt Value USD Drop 7 Up 7 Mean Change 7 Change Predict 0 06480 2 0 4 0 0 000429
Keras 中的条件批量归一化

我正在尝试在 Keras 中实现条件批量标准化我假设我必须创建一个自定义层因此我从正常化 https github com keras team keras blob master keras layers normalization
使用自定义层运行 Keras 模型时出现问题

我目前正在攻读学士学位论文FIIT STU https www fiit stuba sk en html page id 749 其主要目标是尝试复制和验证以下结果study http arxiv org abs 2006 00885 这
Keras Predict_classes 方法返回“列表索引超出范围”错误

我对 CNN 和机器学习总体来说是新手并且一直在尝试遵循 TensorFlow 的图像分类教程现在可以找到Google Colabhere https colab research google com drive 1gwZp7 t
Keras：加载多个模型并在不同线程中进行预测

我正在使用带有张量流核心的 Keras 我想在构造函数中加载 2 个不同的模型然后在不同的线程中进行预测根据请求我尝试在张量流图上下文中加载这些模型但它不起作用我的代码 from keras models import load
从 [tensorflow 1.00] 中的 softmax 层提取概率

使用张量流我有一个 LSTM 分类模型以 softmax 作为最终节点这是我的 softmax 层 with tf name scope Softmax as scope with tf variable scope Softmax
具有高级计算功能的 Keras 自定义层

我想写一些自定义的Keras分层并在层中进行一些高级计算例如使用 Numpy Scikit OpenCV 我知道有一些数学函数keras backend可以对张量进行操作但我需要一些更高级的功能但是我不知道如何正确实现这一点我收到
使用输入管道时如何替换 feed_dict？

假设您有一个已与feed dict到目前为止将数据注入到图表中每隔几个时期我就会通过将任一数据集的一批数据输入到我的图表中来评估训练和测试损失现在出于性能原因我决定使用输入管道看看这个虚拟示例 import tensorflow
Tensorflow GPU 设置：PyCharm 上的 CUDA 错误

我在 Python3 MacOSX El Capitan 上安装了 TF 0 8 当为 TF 运行简单的测试代码时我收到以下消息 ImportError dlopen Library Frameworks Python framework
AttributeError：模块“keras.engine”没有属性“Layer”

当我试图运行时Parking Slot mask rcnn py文件我收到如下错误mrcnn model py文件我该如何解决 gt 2021 06 17 08 25 18 585897 W tensorflow stream execut
如何在 Tensorflow 中使用预训练的 Word2Vec 模型

我有一个Word2Vec训练过的模型Gensim 我如何使用它Tensorflow for Word Embeddings 我不想在 Tensorflow 中从头开始训练嵌入有人可以告诉我如何用一些示例代码来做到这一点吗假设您有一个字典
Tensorboard——High-level节点的计算时间与其子节点计算时间的总和不同

继tutorial https www tensorflow org programmers guide graph viz在 TensorFlow 上我试图使用张量板来理解运行时统计数据我发现代表名称范围的高级节点的计算时间不等于其子

随机推荐

[svn]status命令

wangyetao 64 linux u1604 LinuxRoom SVN FILE 个人空间 xx wangyetao 64 linux u1604 LinuxRoom SVN FILE 个人空间 xx svn help status
维护型项目的管理

最近 xff0c 一直在维护一个项目项目很大 xff0c 有很多个系统相互配合 xff0c 且使用的语言也不一样有JAVA写的系统 xff0c 有PHP写的 xff0c 各系统用的数据库也不一样 xff0c 还有一些我说不出来的技术项
cas5.2.6 搭建cas服务端

1 打包cas服务器端war包下载cas overlay template 5 2 zip 1 1配置pom xml lt dependencies gt lt dependency gt lt groupId gt org apereo
PHP516 用phpize增加扩展PDO_OCI和OCI8

环境 xff1a centos5 5 PHP5 1 6 oracle10 2 0 5 客户端 1 从oracle官网下载oracle客户端包 oracle instantclient basic 10 2 0 5 1 i386 rpm or
npm ERR! enoent This is related to npm not being able to find a file.解决

一问题描述运行sudo npm install color name出现如下错误 xff1a npm ERR path root blog node modules color namenpm ERR code ENOENT npm E
ROS中最重要的变量$ROS_PACKAGE_PATH

昨天刚成功安装了ardrone autonomy 和 tum ardrone xff0c 运行也是通过了今天又尝试了一下昨天的命令 xff0c 结果发现tum ardrone居然又运行不了了 xff0c 郁闷 xff01 说是没有在环境变
用TIKZ在LaTex中画图

我之前是用Edraw max画图的 xff0c 但是有一个致命的问题就是在图上写字母的时候与图解释中不一致 xff0c 所以尝试了一下LaTex画图 xff0c 哎呀 xff0c 耗费我一下午的时间呀首先导入包 xff1a usepack
NLP中三种特征抽取器的优与劣

RNN LSTM GRU xff1a 缺点 xff08 1 xff09 xff1a 无法并行 xff0c 因此速度较慢 xff08 2 xff09 xff1a RNN无法很好地学习到全局的结构信息 xff0c 尤其对于序列结构很长的 CNN
python List中元素两两组合

aa span class token operator 61 span span class token punctuation span span class token string 39 a 39 span span class t
JRE not compatible with project .class file compatibility: 1.7

电脑上刚装了jdk1 7 xff0c 运行一般程序的时候没有出现什么问题 xff0c 由于内存不够用 xff0c 在设置虚拟内存时却出现问题 xff0c 如下 xff1a 还好找到了解决办法 xff0c 错误的原因是JRE库配置与Java
BufferedWriter 的 flush() 方法

package com corpus import java io import java util List import edu stanford nlp ling HasWord import edu stanford nlp lin
正则表达式匹配连续多个空格或tab空格

Pattern p 61 Pattern compile 34 s 2 t 34 Matcher m 61 p matcher str String strNoBlank 61 m replaceAll 34 34 System out p
LaTex中插入花体字母

特别要注意的是 xff1a 在LaTeX中 xff0c 别把希腊字母和英文的花体字母搞混哦 xff0c 哈哈举个例子 xff1a 后面显示的 X 不是希腊字母西即也就是说不能通过 Chi 的方式插入这个特殊符号 xff0c 正确的花
气哭了的C++调试，cmake 找不到 eigen

这才刚刚开头 xff0c 可是就是不知道错误在哪里 xff1f 百度了问题后 xff0c 打开了很多很多相关的解答 xff0c 从昨天上午遇到这个问题 xff0c 历经昨天下午和晚上 xff0c 还是错误 xff0c 终于在今天上午圆满解决
对ORACLE SCN的理解

1 SCN数值实际来源于系统的timestamp xff0c 这个实际可以证明 select current scn from v database select timestamp to scn sysdate from dual 这两个
Ubuntu 下终端界面转图形界面

在运行程序的时候 xff0c 错误的使用了快捷键 ctrl 43 alt 43 F10 然后 unbuntu就黑屏了 xff0c 整个界面只剩下左上角有一个白色的字符在闪 xff0c 然后 Ctrl 43 alt 43 F2时跳出终端的登录
python错误:TypeError: 'module' object is not callable

TrainCorpusStructure py 文件中的代码如下 xff1a class TrainCorpusStructure inputs 61 Demo py中的代码如下 xff1a from corpusProcess impor
python 除法保留两位小数点

span class hljs operator a span 61 span class hljs number 1 span b 61 span class hljs number 3 span print span class hlj
pytorch中contiguous()

contiguous xff1a view只能用在contiguous的variable上如果在view之前用了transpose permute等 xff0c 需要用contiguous 来返回一个contiguous copy 一种可
tensorflow中control_flow_ops.while_loop

self h0 61 tf zeros self batch size self hidden dim self h0 61 tf stack self h0 self h0 相当于 h0和C0 generator on initial r

tensorflow中control_flow_ops.while_loop

tensorflow中control_flow_ops.while_loop 的相关文章

随机推荐

热门标签