在 Keras 中，当我创建具有 N 个“单元”的有状态“LSTM”层时，我到底要配置什么？

2024-01-14

正常的第一个参数Dense层也是units，是该层中神经元/节点的数量。然而，标准 LSTM 单元如下所示：

（这是“的修改版本”了解 LSTM 网络 http://colah.github.io/posts/2015-08-Understanding-LSTMs/")

在 Keras 中，当我创建这样的 LSTM 对象时LSTM(units=N, ...)，我实际上是在创造吗？N这些 LSTM 单元？或者是 LSTM 单元内“神经网络”层的大小，即W是在公式中吗？或者是别的什么？

对于上下文，我正在基于这个示例代码 https://github.com/fchollet/keras/blob/master/examples/stateful_lstm.py.

以下是文档：https://keras.io/layers/recurrent/ https://keras.io/layers/recurrent/

It says:

单位：正整数，输出空间的维数。

这让我认为这是 Keras LSTM“层”对象的输出数量。意味着下一层将有N输入。这是否意味着确实存在NLSTM 层中这些 LSTM 单元的数量，或者也许正是如此oneLSTM 单元的运行时间为N迭代输出N这些h[t]价值观，来自，说，h[t-N] up to h[t]?

如果它只定义输出的数量，这是否意味着输入仍然可以是，比如说one，或者我们是否必须手动创建滞后输入变量x[t-N] to x[t]，每个 LSTM 单元由units=N争论？

当我写这篇文章时，我突然想到这个论点是什么return_sequences做。如果设置为True一切N输出被向前传递到下一层，而如果设置为False它只通过了最后一个h[t]输出到下一层。我对吗？

你可以检查这个问题 https://stackoverflow.com/questions/38714959/understanding-keras-lstms/38737941#38737941了解更多信息，尽管它基于 Keras-1.x API。

基本上，unit表示 LSTM 中内部单元的维度。因为在 LSTM 中，内部单元的维度（图中的 C_t 和 C_{t-1}）、输出掩码（图中的 o_t）和隐藏/输出状态（图中的 h_t）应该具有SAME尺寸，因此您输出的尺寸应该是unit- 长度也是如此。

And LSTM在 Keras 中只定义了一个 LSTM 块，其单元为unit-长度。如果你设置return_sequence=True，它将返回具有形状的东西：(batch_size, timespan, unit). If false，那么它只返回形状中的最后一个输出(batch_size, unit).

至于输入，您应该为每个时间戳提供输入。基本上，形状就像(batch_size, timespan, input_dim), where input_dim可以不同于unit。如果您只想在第一步提供输入，则只需在其他时间步骤用零填充数据即可。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 Keras 中，当我创建具有 N 个“单元”的有状态“LSTM”层时，我到底要配置什么？的相关文章

多输出回归问题的多重损失

所以我试图训练一个 CNN 模型来预测 4 个实值输出回归问题我尝试使用均方误差作为损失函数我的问题是我是否将输出层分支为 4 个不同的输出层其中有 4 个不同的输出层由于最后一层的权重是单独更新的 loss 4 MSE 确实可以使
您必须使用 dtype float(Tensorflow) 为占位符张量“Placeholder”提供值

import tensorflow as tf import os import sklearn preprocessing import pandas as pd import numpy as np print os getcwd os
修改Keras中的层权重

我正在尝试修改 Keras 中某个层的输出我有一个编码器它将时间序列转换为潜在空间之后对于每个压缩的时间序列我想向时间序列添加一些数字例如我有 input d Input 100 h1 d Reshape 100 1 input
导入tensorflow时，出现以下错误：没有名为“numpy.core._multiarray_umath”的模块

我已经安装了 Ancaconda3 和 Tensorflow 当我尝试在 python shell 中导入 Tensorflow 时收到以下错误 ModuleNotFoundError 没有名为 numpy core multiarray
用于测试张量流安装的速度基准

我怀疑我的 GPU 机器上是否正确配置了张量流因为在我精美的 GPU 机器上训练一个简单的线性回归模型批量大小 32 1500 个输入特征 150 个输出变量的每次迭代速度比在笔记本电脑上慢 100 倍我使用的是 Titan X 配
为什么 scikit learn 的平均精度分数返回 nan？

我的 Keras 模型旨在接收两个输入时间序列将它们连接起来通过 LSTM 提供它们并在下一个时间步骤中进行多标签预测有 50 个训练样本每个样本有 24 个时间步每个样本有 5625 个标签有 12 个验证样本每个样本有
tf.gfile 在 TensorFlow 中起什么作用？

我见过人们使用以下几个函数tf gfile例如tf gfile GFile or tf gfile Exists 我有一个想法tf gfile处理文件但是我无法找到官方文档来了解它还提供了什么如果你能帮我的话那就太好了对于登陆这里的
AssertionError: d['w'] | 的值错误深度学习专业化

我正在完成深度学习专业的第一门课程其中第一个编程任务是从头开始构建逻辑回归模型由于这是我第一次从头开始构建模型而且我花了一些时间来消化高等数学所以我有很多错误其中我发现了一个我完全无法修复并且无法理解的问题这是一个断言错误说
使用 tf.keras.Models.Sequential 构建的架构是否比使用 Tensorflow 的功能 API 构建的架构运行得更慢、更准确？

我只是比较了 2 个我认为等效的 VGG ish 架构一个是使用构建的tf keras Models Sequential 另一个用了Tensorflow 的函数式 API 每个人都试图解决cats vs dogs 数据集经过 10
Tensorflow seq2seq 获取序列隐藏状态

我不久前才开始研究tensorflow 我正在研究 seq2seq 模型并以某种方式让教程起作用但我一直坚持获取每个句子的状态据我了解 seq2seq 模型采用输入序列并通过 RNN 为序列生成隐藏状态随后模型使用序列的隐藏状态来
有没有办法在bigquery中使用kmeans、tensorflow保存的模型？

我知道这有点愚蠢因为 BigQueryML 现在为 Kmeans 提供了良好的初始化尽管如此我还是需要在张量流中训练一个模型然后将其传递给 BigQuery 进行预测我保存了模型一切正常直到我尝试将其上传到 bigquery
batch_size = x.shape[0] AttributeError: 'tuple' 对象没有属性 'shape'

该代码结合图像和掩模进行图像检测我怎样才能纠正这个错误 batch size x shape 0 AttributeError tuple 对象没有属性 shape 这是用于训练的代码 train datagen ImageDataGen
预处理 csv 文件以与 tflearn 一起使用

我的问题是关于在将 csv 文件输入神经网络之前对其进行预处理我想使用 python 3 中的 tflearn 为著名的 iris 数据集构建一个深度神经网络数据集 http archive ics uci edu ml machine
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
Pytorch LSTM：计算交叉熵损失的目标维度

我一直在尝试在 Pytorch 中使用 LSTM LSTM 后跟自定义模型中的线性层但在计算损失时出现以下错误 Assertion cur target gt 0 cur target lt n classes failed 我用以下函数
ubuntu 20.04 上无法获取卷积算法错误~tensorflow-gpu

我有一个 NVIDIA 2070 RTX GPU 我的操作系统是 Ubuntu20 04 我已经使用 conda 安装了tensorflow gpu 包我有not安装了 CUDA toolkit 我相信它还会安装 CUDA toolkit
类型错误：预期单个张量时的张量列表 - 将 const 与 tf.random_normal 一起使用时

我有以下 TensorFlow 代码 tf constant tf random normal time step batch size 1 1 我正进入状态TypeError List of Tensors when single Te
GPU 上的张量流：尽管 cuda 的 deviceQuery 返回“PASS”结果，但没有已知设备

注这个问题最初是在github上问的 https github com tensorflow tensorflow issues 7648 issuecomment 280866214 但被要求改为在这里我在 GPU 上运行 Tenso
图书馆神经实验室培训纽夫

我对 python 和 Neurolab 的使用还很陌生我在前馈神经网络的训练方面遇到了问题我已经构建了如下网络 net nl net newff 1 1 64 60 1 net init testerr net train Input
如何从张量流数据集迭代器返回同一批次两次？

我正在转换一些旧代码以使用数据集 API 此代码使用feed dict将一批数据送入列车运行实际上是三次然后重新计算损失以供显示使用同一批所以我需要一个迭代器来返回完全相同的批次两次或多次不幸的是我似乎找不到一种使用张量流数据集

随机推荐

Equals() 与静态 string.Equals()

在阅读 C 中的字符串比较时我发现了很多方法来比较 2 个字符串以查看它们是否相等我已经习惯了来自 C 但我了解到如果将对象与字符串进行比较那么默认为参考值或类似的值那么对于Equals 方法可以说我有 2 个字符串 str
尝试让 Spring/Consul/Vault 协同工作

我正在尝试做一些我认为简单的事情我想用Consul https www consul io用于配置以及Vault https www vaultproject io为了秘密我正在寻找一个像这样的简单应用程序它允许我从 Consul
在 Mac 上哪里可以找到 bashrc 文件？

你好我正在关注这个page http docs python guide org en latest starting install osx 我正在我的 mac 上安装 Python 以便我可以设置Django Eclipse开发环境但
覆盖 google.com 匿名函数的一部分

如果一个 javascript 函数是匿名声明的有什么方法可以覆盖它或它的一部分吗我试图阻止 google com 的即时搜索劫持向上和向下箭头键以在您的搜索排名中移动我已经确定了我认为有问题的代码部分键码 38 和 40 用于向下
如何自定义魅力报告标题和徽标

下面附上通过 allure 生成的 allure 报告图像想要使用我自己的标题和徽标而不是 ALLURE REPORT 和默认徽标来自定义报告标题和徽标图像突出显示为黄色感谢你的帮助要更改徽标您应该将自定义徽标插件放入插件文件夹中
如何正确删除和重新添加实体数据模型

这里是实体框架的新手使用VS 2010和SQL Server 2008 Express DB 添加新表后我在刷新实体数据模型时遇到问题因此我遵循了在这里找到的建议删除并重新生成模型我进入实体数据模型向导的选择您的数据连接部分
根据格式为 %d/%m/%Y 的日期按时间顺序排序数据帧

我有一些数据必须格式化为 d m Y 数据不按时间顺序排列因为它是按第一个数字日而不是月份排序的我希望我能指定order or reorder我希望排序以不同的方式进行我只是不知道该怎么做以下是一些要订购的日期数据 date 1
相当于 Struts 1.x“bean:define”标签？

我正在致力于将旧的 Struts 1 x 应用程序转换为 Spring MVC 并且在一些 JSP 页面中 bean define标签用于从资源包中获取字符串然后在页面中稍后使用
如何查找 Active Directory OAuth 身份验证的受众字段？（如何从 Azure 逻辑应用程序向 DevOps 发送发布请求？）

请帮我解决这个问题我正在尝试从 Azure 逻辑应用程序向 DevOps 发送发布请求以创建发布我在逻辑应用程序中创建了一个 http 操作这是用于创建发布的 uri https vsrm dev azure com https vs
清理遗留代码“header spaghetti”

任何清理标题意大利面的推荐做法这会导致极其严重的后果编译时间慢 Linux Unix GCC 中是否有相当于 pragma Once 的东西发现与此相关的冲突消息 Thanks 假设您熟悉包含防护 ifdef 在标头开头加快构
使用 opencv 从 SIFT 生成百分比相似度分数

在 python 2 7 x opencv 2 4 9 中使用 SIFT 比较两个图像后我一直试图找到一种生成相似性得分以为单位的方法我只能找到在比赛之间画线的例子我该怎么做呢 Matlab 中有一个相当于 vl ubcmatc
在 for 循环中等待点击事件 - 类似于prompt()

这可能没有最伟大的标题我试图理解回调函数我想知道如何在不丢失 for 循环的情况下替换以下代码中的提示 for i 0 i lt 4 i let x prompt Input an integer store input into an
JAXB 解组验证抛出 cvc-elt.1: 找不到元素声明错误

我对 JAXB 和验证有点陌生并且花了几个小时试图解决这个问题但无济于事我创建了一个简单的 JAXB 解组器示例来解析 XML 文件我也创建了一个适当的 XSD 文件但验证器一直抱怨它无法找到元素的声明我认为这可能与命名空间问题
从多列表框中取消选择时如何获取当前选定的选项值

您好我有如下所示的多选列表框 div class id 100 div
scipy 链接格式

我已经编写了自己的聚类例程并希望生成树状图最简单的方法是使用 scipy dendrogram 函数但是这要求输入的格式与 scipy 链接函数生成的格式相同我找不到如何格式化输出的示例我想知道是否有人可以启发我我同意http
这也叫适配器吗？ + 适配器与装饰器

我有 2 个项目 A 和 B 它们应该相互交互项目A引入接口名称ISpecialTask 项目B应该实现它 Projet B 有一个名为 TaskWithListOfProperties 的实体该实体无法实现 ISpecialTask
C++ 支持成员函数引用吗？

C 允许函数指针 and 函数参考 https stackoverflow com questions 480248 function references 它还允许指向成员函数的指针 But 是否允许引用成员函数我似乎无法从标准中推断出
Emacs 颜色。为什么当前行是灰色的？森伯恩主题

我安装了Prelude https github com bbatsov prelude在我的 emacs24 上我使用的是ubuntu 12 04 我第一次使用它时效果很好但接下来的次数就不行了在我当前的行上字体颜色是灰色的因此
ngx-翻译和 *ngFor

我有这个代码 div span img alt span h4 service name h4 p service desc p div 如何对具有 3 个参数的每个服务进行翻译在正常情况下我使用 something translate
在 Keras 中，当我创建具有 N 个“单元”的有状态“LSTM”层时，我到底要配置什么？

正常的第一个参数Dense层也是units 是该层中神经元节点的数量然而标准 LSTM 单元如下所示这是的修改版本了解 LSTM 网络 http colah github io posts 2015 08 Understandi

在 Keras 中，当我创建具有 N 个“单元”的有状态“LSTM”层时，我到底要配置什么？

在 Keras 中，当我创建具有 N 个“单元”的有状态“LSTM”层时，我到底要配置什么？ 的相关文章

随机推荐

热门标签

在 Keras 中，当我创建具有 N 个“单元”的有状态“LSTM”层时，我到底要配置什么？的相关文章