无法理解tensorflow keras层中“build”方法的行为（tf.keras.layers.Layer）

2024-01-09

张量流keras中的层有一个方法build它用于将权重创建推迟到您了解输入内容的时间。图层的构建方法 https://www.tensorflow.org/api_docs/python/tf/keras/layers/Layer#build

我有几个问题无法找到答案：

here https://www.tensorflow.org/guide/keras/custom_layers_and_models#layers_are_recursively_composable据说

If you assign a Layer instance as attribute of another Layer, the outer layer will start tracking the weights of the inner layer.

跟踪层的权重意味着什么？

The same link also mentions that

我们建议在init方法（由于子层通常有一个构建方法，因此它们将在构建外层时构建）。

这是否意味着在运行时build子类（self）的方法，将迭代其所有属性self以及被发现是（的实例）的子类tf.keras.layer.Layer将会有他们的build方法自动运行？

我可以运行这段代码：

class Net(tf.keras.Model):
  """A simple linear model."""

  def __init__(self):
    super(Net, self).__init__()
    self.l1 = tf.keras.layers.Dense(5)
  def call(self, x):
    return self.l1(x)

net = Net()
print(net.variables)

但不是这个：

class Net(tf.keras.Model):
  """A simple linear model."""

  def __init__(self):
    super(Net, self).__init__()
    self.l1 = tf.keras.layers.Dense(5)
  def build(self,input_shape):
    super().build()
  def call(self, x):
    return self.l1(x)

net = Net()
print(net.variables)

why?

我会说build提到的意思是，当你构建一个自定义的 tf.keras.Model 时

net = Net()

那么你会得到所有tf.keras.layers.Layer对象创建于__init__，并存储在net这是一个可调用对象。这样的话就成为一个完成的对象供TF后面训练了，是这样说的to track。下次你打电话的时候net(inputs)你会得到你的输出。

下面是Tensorflow自定义解码器的例子，带attention

class BahdanauAttention(tf.keras.layers.Layer):
  def __init__(self, units):
    super(BahdanauAttention, self).__init__()
    self.W1 = tf.keras.layers.Dense(units)
    self.W2 = tf.keras.layers.Dense(units)
    self.V = tf.keras.layers.Dense(1)

  def call(self, query, values):
    # query hidden state shape == (batch_size, hidden size)
    # query_with_time_axis shape == (batch_size, 1, hidden size)
    # values shape == (batch_size, max_len, hidden size)
    # we are doing this to broadcast addition along the time axis to calculate the score
    query_with_time_axis = tf.expand_dims(query, 1)

    # score shape == (batch_size, max_length, 1)
    # we get 1 at the last axis because we are applying score to self.V
    # the shape of the tensor before applying self.V is (batch_size, max_length, units)
    score = self.V(tf.nn.tanh(
        self.W1(query_with_time_axis) + self.W2(values)))

    # attention_weights shape == (batch_size, max_length, 1)
    attention_weights = tf.nn.softmax(score, axis=1)

    # context_vector shape after sum == (batch_size, hidden_size)
    context_vector = attention_weights * values
    context_vector = tf.reduce_sum(context_vector, axis=1)

    return context_vector, attention_weights

class Decoder(tf.keras.Model):
  def __init__(self, vocab_size, embedding_dim, dec_units, batch_sz):
    super(Decoder, self).__init__()
    self.batch_sz = batch_sz
    self.dec_units = dec_units
    self.embedding = tf.keras.layers.Embedding(vocab_size, embedding_dim)
    self.gru = tf.keras.layers.GRU(self.dec_units,
                                   return_sequences=True,
                                   return_state=True,
                                   recurrent_initializer='glorot_uniform')
    self.fc = tf.keras.layers.Dense(vocab_size)

    # used for attention
    self.attention = BahdanauAttention(self.dec_units)

  def call(self, x, hidden, enc_output):
    # enc_output shape == (batch_size, max_length, hidden_size)
    context_vector, attention_weights = self.attention(hidden, enc_output)

    # x shape after passing through embedding == (batch_size, 1, embedding_dim)
    x = self.embedding(x)

    # x shape after concatenation == (batch_size, 1, embedding_dim + hidden_size)
    x = tf.concat([tf.expand_dims(context_vector, 1), x], axis=-1)

    # passing the concatenated vector to the GRU
    output, state = self.gru(x)

    # output shape == (batch_size * 1, hidden_size)
    output = tf.reshape(output, (-1, output.shape[2]))

    # output shape == (batch_size, vocab)
    x = self.fc(output)

    return x, state, attention_weights

我试过把tf.keras.layers.Layer对象在call并得到了非常糟糕的结果，我猜那是因为如果你把它放进去call那么每次发生前向后向传播时，它都会被多次调用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

Keras

tensorflow20

keraslayer

tfkeras

无法理解tensorflow keras层中“build”方法的行为（tf.keras.layers.Layer）的相关文章

如何将 std::vector 转换为张量而不在 C++ 中的张量流中进行复制？

在c 中多维矩阵存储在std vector
无法更改现有 Keras 模型中的激活

我有一个普通的 VGG16 模型relu激活即 def VGG 16 weights path None model Sequential model add ZeroPadding2D 1 1 input shape 3 224 224
导入tensorflow时，出现以下错误：没有名为“numpy.core._multiarray_umath”的模块

我已经安装了 Ancaconda3 和 Tensorflow 当我尝试在 python shell 中导入 Tensorflow 时收到以下错误 ModuleNotFoundError 没有名为 numpy core multiarray
为什么 scikit learn 的平均精度分数返回 nan？

我的 Keras 模型旨在接收两个输入时间序列将它们连接起来通过 LSTM 提供它们并在下一个时间步骤中进行多标签预测有 50 个训练样本每个样本有 24 个时间步每个样本有 5625 个标签有 12 个验证样本每个样本有
Tensorboard 和 Dropout 层

我有一个非常基本的查询我制作了 4 个几乎相同差异在于输入形状的 CNN 并在连接到全连接层的前馈网络时合并了它们几乎相同的 CNN 的代码 model3 Sequential model3 add Convolution2D 32
tf.gfile 在 TensorFlow 中起什么作用？

我见过人们使用以下几个函数tf gfile例如tf gfile GFile or tf gfile Exists 我有一个想法tf gfile处理文件但是我无法找到官方文档来了解它还提供了什么如果你能帮我的话那就太好了对于登陆这里的
使用 flow_from_dataframe y_col 的正确“值”是什么

我正在用 pandas 读取 csv 文件并给出存储在中的列名称colname colnames file label Read data from file data pd read csv Hand Annotations 2 csv
从 Keras 检查点加载

我正在 Keras 中训练一个模型我使用以下代码保存了所有内容 filepath project model hdh5 checkpoint ModelCheckpoint project model hdf5 monitor loss
使用 tf.keras.Models.Sequential 构建的架构是否比使用 Tensorflow 的功能 API 构建的架构运行得更慢、更准确？

我只是比较了 2 个我认为等效的 VGG ish 架构一个是使用构建的tf keras Models Sequential 另一个用了Tensorflow 的函数式 API 每个人都试图解决cats vs dogs 数据集经过 10
Tensorflow中的Tensor和Variable有什么区别

有什么区别Tensor and Variable在张量流中我注意到在这个 stackoverflow 答案 https stackoverflow com questions 38556078 in tensorflow what is
Tensorflow如何生成不平衡组合数据集

我对新数据集 API tensorflow 1 4 有疑问我有两个数据集我需要创建一个组合的不平衡数据集即每个批次应包含第一个数据集中一定数量的元素和第二个数据集中一定数量的元素例如 dataset1 tf data Datase
Tensorflow：尽管数据中没有字符串，但使用 tflearn 时不支持将字符串转换为浮点数错误

我似乎无法在我的代码中找到错误其中有任何字符串被错误地转换为浮点数但它却给了我这个错误 W tensorflow core framework op kernel cc 958 Unimplemented Cast string to
如何强制tensorflow使用所有可用的GPU？

我有一个 8 GPU 集群当我运行Kaggle 的一段 Tensorflow 代码 https www kaggle com keegil keras u net starter lb 0 277 scriptVersionId 2164
有没有办法在bigquery中使用kmeans、tensorflow保存的模型？

我知道这有点愚蠢因为 BigQueryML 现在为 Kmeans 提供了良好的初始化尽管如此我还是需要在张量流中训练一个模型然后将其传递给 BigQuery 进行预测我保存了模型一切正常直到我尝试将其上传到 bigquery
AttributeError：模块“tensorflow.python.framework.ops”没有属性“RegisterShape”

我正在使用 TensorFlow 2 1 0 dev20191125 不幸的是我无法编译一个带有错误的简单示例 AttributeError 模块 tensorflow python framework ops 没有属性 Registe
如何在 py_function 之后重塑（图像，标签）数据集

我正在尝试读取自定义映射数据集进行训练但是在使用 py function 映射数据集后我得到了未知的形状例如 def process path file path label get label file path img tf io
Keras 模型无法预测是否在线程中调用

我尝试在线程应用程序中使用 keras 和可用模型 VGG16 执行预测但是如果我在主线程中调用预测一切都会正常但是如果我在线程函数内部进行预测无论我使用threading multiprocessing 它只是在预测过程中停止
类型错误：预期单个张量时的张量列表 - 将 const 与 tf.random_normal 一起使用时

我有以下 TensorFlow 代码 tf constant tf random normal time step batch size 1 1 我正进入状态TypeError List of Tensors when single Te
如何解释tf.map_fn的结果？

看代码 import tensorflow as tf import numpy as np elems tf ones 1 2 3 dtype tf int64 alternates tf map fn lambda x x x x el
如何从张量流数据集迭代器返回同一批次两次？

我正在转换一些旧代码以使用数据集 API 此代码使用feed dict将一批数据送入列车运行实际上是三次然后重新计算损失以供显示使用同一批所以我需要一个迭代器来返回完全相同的批次两次或多次不幸的是我似乎找不到一种使用张量流数据集

随机推荐

Ho 在混合应用程序（主要语言 ObjC）中从 Swift 获取对 appdelegate 的引用以避免引用循环

首先我知道这一点如何获取 Swift 中应用程序委托的引用 https stackoverflow com questions 24046164 how do i get a reference to the app delegate i
如何在Python中按顺时针/逆时针方向对点列表进行排序？

我得到了坐标点列表我想按顺时针逆时针对它们进行排序这是我提到的清单 985 268 112 316 998 448 1018 453 1279 577 1196 477 1161 443 986 0 830 0 983 230 998
MYSQL使用count(*)进行选择查询

我有一个关于 MYSQL 中的选择查询的问题我有两个不同的表我想获得某个结果我使用了 COUNT 方法它只给了我结果 gt 1 但实际上我想使用包含零的所有计数该怎么做我的查询是 SELECT first subscriber
什么时候一个对象适合垃圾收集器？

考虑这个示例代码 1 public class GC 2 private Object o 3 private void doSomethingElse Object obj o obj 4 public void doSomething
声明终止。在语句完成之前最大递归 100 已用完

设置表和示例数据 USE LDS GO Object Table dbo Table DownLineList Script Date 11 14 2013 11 45 31 SET ANSI NULLS ON GO SET QUOTED
UIImage imageNamed 不适用于 ios 5.0

我使用这段代码图像集图像 UIImage imageNamed 电子邮件受保护 cdn cgi l email protection 它适用于 ios 4 3 但在 ios 5 0 上我看不到我的图像有谁知道这个问题属于哪一类您通常不
DataGridView - 父子数据库关系 - 更新子 DataGridView 数据

有人愿意帮助我完成以下事项吗我有两个 DataGridView 对象每个对象显示一个 DataTable 其中两个数据表与以下代码相关 DataSet dSet new DataSet DataTable ParentList List
找不到 uri [//<type>/] 和方法 [PUT] 的处理程序

我正在尝试使用插入文档 api 的自动增量 id 功能向我的 elasticsearch 索引发出原始 NodeJS http 请求所以这适用于curl curl XPOST http host 3333 catalog products
JavaScript 中的土耳其语大小写转换

我想在我想要的语言环境中将 JavaScript 中的字符串转换为小写或大写我认为标准功能就像toUpperCase and toLocaleUpperCase 不能满足这个需要 toLocale函数没有按其应有的方式运行例如在我的系
无法解析远程名称

我正在为 Windows Mobile 6 创建移动应用程序我正在 url 网站上上传图像为此我使用 webrequest 和 webresponse 类在获得响应时我收到此类错误无法解析远程名称我的代码是字符串网址 htt
在 lucene BooleanQuery 中将整个句子与空格匹配

我有一个搜索字符串 Tulip INN Riyadhh Tulip INN Riyadhh LUXURY Suites of Tulip INN RIYAHdhh 如果我提到的话我需要搜索词 Tulip INN Riyadhh 它必须返回
获取页面墙上其他人的帖子（Facebook API）

我四处寻找但找不到答案所以我在这里尝试是否可以在页面墙上获取其他人的帖子参见图片作为示例 http d pr i fklT http d pr i fklT 通过 Facebook 的 API 我尝试过使用 PAGE ID post
如何在没有输出的情况下打开 IPython 笔记本？

我有一个 IPython 笔记本我不小心转储了一个巨大的输出 15 MB 导致笔记本崩溃现在当我打开笔记本并尝试删除有问题的单元格时笔记本再次崩溃从而使我无法解决问题并使笔记本恢复稳定我能想到的最好的解决方法是将输入单元手动粘贴
Spark.eventLog.dir和spark.history.fs.logDirectory有什么区别？

Spark中事件日志目录和历史服务器日志目录有什么区别 spark eventLog dir hdfs var log spark apps spark history fs logDirectory hdfs var log spark
Heroku 上的 Spring Boot Gradle 应用程序：无法访问 jarfile

我有一个 spring boot gradle 应用程序可以通过执行以下操作在我的 PC 上成功运行 heroku local 当我去的时候它也可以成功部署在heroku上 git push heroku master 这是我的结果 Co
Java socket编程中如何实现客户端与服务器的持续交互

Java Socket 编程中如何实现客户端与服务器的持续交互在我的程序中我的目录中有许多文件夹即 F read 我正在将包含文件的文件夹从客户端传输到服务器当第一次请求时一个文件夹从客户端传输到服务器当再次向客户端发送另一个文
SplitAt 3 然后继续分裂

我想在 Haskell 中每 3 个字母分割一个字符串我尝试过使用splitAt但我必须重复此操作直到字符串每 3 个字母被分割一次有没有办法做到这一点 E g WEAREDISCOVERED 会成为 WEA RED ISC OVE
将字符串拆分为交替的单词（Scala）

我想将一个字符串分割成交替的单词总会有一个偶数 e g val text this here is a test sentence 应该转换为某种有序集合类型其中包含 this is test and here a sentence 我
numpy 中的局部均值滤波器

我有一个 512x512x512 numpy 数组是否有任何有效的方法来执行均值过滤器其中每个数组值都被所有 3x3x3 本地值替换我们正在寻找类似的东西scipy ndimage filters median filter但用平均值
无法理解tensorflow keras层中“build”方法的行为（tf.keras.layers.Layer）

张量流keras中的层有一个方法build它用于将权重创建推迟到您了解输入内容的时间图层的构建方法 https www tensorflow org api docs python tf keras layers Layer build

无法理解tensorflow keras层中“build”方法的行为（tf.keras.layers.Layer）

无法理解tensorflow keras层中“build”方法的行为（tf.keras.layers.Layer） 的相关文章

随机推荐

热门标签

无法理解tensorflow keras层中“build”方法的行为（tf.keras.layers.Layer）的相关文章