Keras 中的 LSTM 序列预测仅输出输入中的最后一步

2024-01-06

我目前正在使用 Keras 使用 Tensorflow 作为后端。我有一个 LSTM 序列预测模型，如下所示，我用它来预测数据系列中的一步（输入 30 个步骤 [每个步骤有 4 个特征]，输出预测步骤 31）。

model = Sequential()

model.add(LSTM(
    input_dim=4,
    output_dim=75,
    return_sequences=True))
model.add(Dropout(0.2))

model.add(LSTM(
    150,
    return_sequences=False))
model.add(Dropout(0.2))

model.add(Dense(
    output_dim=4))
model.add(Activation("linear"))

model.compile(loss="mse", optimizer="rmsprop")
return model

我遇到的问题是，在训练模型并测试它之后 - 即使使用与训练相同的数据 - 它输出的内容本质上是输入中的第 30 步。我的第一个想法是我的数据模式一定太复杂而无法准确预测，至少对于这个相对简单的模型来说是这样，所以它可以返回的最佳答案本质上是输入的最后一个元素。为了限制过度拟合的可能性，我尝试将训练时期减少到 1，但出现了相同的行为。不过，我以前从未观察到这种行为，而且我以前曾使用过此类数据并取得了成功的结果（就上下文而言，我使用的是从具有主动稳定器的复杂物理系统上的 4 个点获取的振动数据；使用预测在 pid 循环中以实现稳定，因此，至少现在，我使用更简单的模型来保持速度快）。

这听起来是最有可能的原因，还是有人有其他想法？以前有人见过这种行为吗？如果它有助于可视化，这里是一个振动点与所需输出相比的预测结果（注意，这些屏幕截图放大了非常大的数据集的较小选择 - 正如@MarcinMożejko 注意到我没有缩放完全相同）次所以任何偏移图像之间因此，目的是显示预测和真实数据之间的水平偏移在每个图像内):

...与输入的第 30 步相比：

注意：Keras 模型看到的每个数据点都是许多实际测量值的平均值，并且平均值的窗口随时间进行处理。这样做是因为振动数据在我可以测量的最小分辨率下非常混乱，因此我使用这种移动平均技术来预测较大的运动（无论如何，这是要抵消的更重要的运动）。这就是为什么第一张图像中的偏移会出现很多点偏移，而不是只有一个偏移点，它是“一个平均值”或 100 个单独的偏移点。。

-----编辑1，用于从输入数据集“X_test，y_test”获取上面显示的图的代码-----

model_1 = lstm.build_model()  # The function above, pulled from another file 'lstm'

model_1.fit(
    X_test,
    Y_test,
    nb_epoch=1)

prediction = model_1.predict(X_test)

temp_predicted_sensor_b = (prediction[:, 0] + 1) * X_b_orig[:, 0]

sensor_b_y = (Y_test[:, 0] + 1) * X_b_orig[:, 0]

plot_results(temp_predicted_sensor_b, sensor_b_y)
plot_results(temp_predicted_sensor_b, X_b_orig[:, 29])

对于上下文：

X_test.shape = (41541, 30, 4)

Y_test.shape = (41541, 4)

X_b_orig 是来自 b 传感器的原始数据（如上所述进行平均）。在绘图时将其乘以预测和输入数据以撤消我为改进预测所做的标准化。它的形状为 (41541, 30)。

----编辑2----

以下是演示此行为的完整项目设置的链接：

https://github.com/ebirck/lstm_sequence_prediction https://github.com/ebirck/lstm_sequence_prediction

这是因为对于您的数据（股票数据？），第 31 个值的最佳预测是第 30 个值本身。该模型是正确的并且适合数据。我在预测股票数据方面也有类似的经验。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Keras 中的 LSTM 序列预测仅输出输入中的最后一步的相关文章

调用 tf.linalg.inv 时，TensorFlow 崩溃并显示无法创建 cuSolverDN 实例

我正在运行tensorflow tensoflow latest gpu码头集装箱我可以运行简单的向量运算例如矩阵乘法没有问题但是当我运行以下最小示例时 import tensorflow as tf tf linalg inv
如何访问 tf.layers.conv2d 中的内核变量？

我想可视化卷积层中的权重以观察它们如何变化但我找不到一种方法来访问卷积层中的权重tf layers conv2d 谢谢您可以通过名称访问该变量 weights sess run
从 [tensorflow 1.00] 中的 softmax 层提取概率

使用张量流我有一个 LSTM 分类模型以 softmax 作为最终节点这是我的 softmax 层 with tf name scope Softmax as scope with tf variable scope Softmax
ValueError：形状（无，50）和（无，1）在 Tensorflow 和 Colab 中不兼容

我正在使用 LSTM 训练 Tensorflow 模型以进行预测维护对于每个实例我创建一个矩阵 50 4 其中 50 是历史序列的长度 4 是每个记录的特征数量因此为了训练模型我使用例如 55048 50 4 张量和 55048 1
无法更改现有 Keras 模型中的激活

我有一个普通的 VGG16 模型relu激活即 def VGG 16 weights path None model Sequential model add ZeroPadding2D 1 1 input shape 3 224 224
在 Tensorflow 对象检测 API 中将图像裁剪到边界框

如何将图像裁剪到 Tensorflow 中的边界框我正在使用Python API 从文档来看 tf image crop to bounding box image offset height offset width target he
tf.gfile 在 TensorFlow 中起什么作用？

我见过人们使用以下几个函数tf gfile例如tf gfile GFile or tf gfile Exists 我有一个想法tf gfile处理文件但是我无法找到官方文档来了解它还提供了什么如果你能帮我的话那就太好了对于登陆这里的
选择fasta文件中氨基酸超过300个且“C”出现至少4次的序列

我有一个包含蛋白质序列的 fasta 文件我想选择超过 300 个氨基酸且半胱氨酸 C 氨基酸出现超过 4 次的序列我使用此命令来选择具有超过 300 个 aa 的序列 cat 72hDOWN fasta fasta bioawk c
通过 cmake 使用预编译的张量流

我已经建立了一个 C 项目CLion使用CMake 我正在使用各种第三方库并且还想集成张量流我试过了bazel编译张量流到共享库libtensorflow so哪种工作有效但是仍然有相当多的依赖项例如当前的 protobuf 版本
Tensorflow中的Tensor和Variable有什么区别

有什么区别Tensor and Variable在张量流中我注意到在这个 stackoverflow 答案 https stackoverflow com questions 38556078 in tensorflow what is
conv1D 中形状的尺寸

我尝试过构建一个只有一层的 CNN 但遇到了一些问题事实上编译器告诉我 ValueError 检查模型输入时出错预期的 conv1d 1 input 具有 3 个维度但得到形状为 569 30 的数组这是代码 import num
Tensorflow新Op CUDA内核内存管理

我已经使用 GPU CUDA 内核在 Tensorflow 中实现了一个相当复杂的新 Op 该操作需要大量动态内存分配这些变量不是张量并且在操作完成后被释放更具体地说它涉及使用哈希表现在我正在使用cudaMalloc and cu
从字符串列表创建 TfRecords 并在解码后在张量流中提供图形

目的是创建 TfRecords 数据库给定我有 23 个文件夹每个文件夹包含 7500 个图像以及 23 个文本文件每个文件有 7500 行描述单独文件夹中 7500 个图像的特征我通过以下代码创建了数据库 import ten
Tensorflow seq2seq 获取序列隐藏状态

我不久前才开始研究tensorflow 我正在研究 seq2seq 模型并以某种方式让教程起作用但我一直坚持获取每个句子的状态据我了解 seq2seq 模型采用输入序列并通过 RNN 为序列生成隐藏状态随后模型使用序列的隐藏状态来
有没有办法在bigquery中使用kmeans、tensorflow保存的模型？

我知道这有点愚蠢因为 BigQueryML 现在为 Kmeans 提供了良好的初始化尽管如此我还是需要在张量流中训练一个模型然后将其传递给 BigQuery 进行预测我保存了模型一切正常直到我尝试将其上传到 bigquery
无需安装 Tensorflow 即可服务 Tensorflow 模型

我有一个经过训练的模型想在 python 应用程序中使用但我看不到任何在不安装 TensorFlow 或创建 gRPC 服务的情况下部署到生产环境的示例有可能吗在这种情况下正确的做法是什么如果不使用 TensorFlow 本身或
安装后 Anaconda 提示损坏

我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是安装后当我关闭提示窗口并打开新航站楼弹出
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
在tensorflow.js中对张量进行分区、屏蔽或过滤

我有 2 个相同长度的张量 data and groupIds 我想分开data通过相应的值分成几组groupId 例如 const data tf tensor 1 2 3 4 5 const groupIds tf tensor 0 1
Pytorch LSTM：计算交叉熵损失的目标维度

我一直在尝试在 Pytorch 中使用 LSTM LSTM 后跟自定义模型中的线性层但在计算损失时出现以下错误 Assertion cur target gt 0 cur target lt n classes failed 我用以下函数

随机推荐

将值合并到数组中

我遇到的情况是我必须手动将标签与值合并然后存储在数组中例如aaa 10 bbb 20 ccc 30 这些值来自文本字段最后我必须以这种格式提供用逗号分隔标签是硬编码的如何创建这样的数组或字符串aaa 10 bbb 20 ccc
安装框架（问题 cURL 错误 6：无法解析主机：cache-proxy）

我尝试安装 api platform https api platform com docs distribution https api platform com docs distribution 启动后我在日志中看到 api plat
分析我的程序的时间复杂度

我在确定算法的时间复杂度时遇到问题 for int i 0 i
使用XElement保存XML文件时，文件的对齐方式也会发生变化，如何避免？

我在用 XElement root XElement Load filepath 加载 XML 文件然后找到我需要的东西 IEnumerable
GitKraken 启用长路径的 .git 配置文件在哪里

到目前为止我已经从命令行运行程序和 GitHub Desktop 使用了 Git 我尝试使用 GitKraken 但它有一个很大的问题我有一个存储库它有真正的嵌套文件夹超过了 256 个长度这个问题很容易用 Git 和 GitHu
在枚举内部提供函数是否被认为是“干净的”？

我在源代码中发现了一些代码这些代码基本上使用 switch case 来遍历枚举的每个可能值并调用根据数据类型返回 Number 对象的适当函数这是一个片段 case TYPE 16BIT SIGNED BE measurement
使用配置文件打包 Python 应用程序

我正在使用 ConfigParser 来配置我的应用程序现在我想让它易于分发同时保留可配置性我想我需要一个包含配置文件模板的目录以及一些生成配置以实际使用的方法然后我需要一个可以在 virtualenv 用户主目录等中工作的地方来
由于环境错误，pip install pandas 失败

我正在尝试安装 pandas 但收到此错误 Collecting pandas Retrying Retry total 4 connect None read None redirect None status None after co
更改超出范围的变量？

有什么方法可以在超出范围时更改变量吗我知道一般来说你不能但我想知道是否有任何技巧或覆盖例如有什么方法可以完成以下工作 function blah var a 1 a 2 alert blah 编辑为了澄清假设的场景是修改 se
有没有一种 CSS 方法可以按照黄金比例垂直定位 HTML 元素？

我想仅使用 CSS 将 HTML 元素定位在水平中间和垂直黄金比例中元素的高度必须是绝对灵活的所以我不能只设置top attribute和element height为百分比值有什么办法可以做到这一点吗示意图在图像中相同颜色的箭
是否可以在域和子域之间共享 cookie

我正在尝试在 www example com 和 admin other example com 之间共享 cookie 我已经能够使其与 other example com 一起使用但无法访问子子域编辑我通过将 cookie 域定义
在 Windows 上的 Excel VBA 中，对于解析的 JSON 变量，这个 JScriptTypeInfo 到底是什么？

在这里回答我自己的问题我已经在 Excel VBA 中使用 JSON 做了一些工作并发布了很多发现我将以问答的形式进行https stackoverflow com help self answer https stackoverfl
memcached 客户端：打开、关闭和重用连接

我一直在测试spymemcached 和xmemcached 客户端我一直在尝试在项目文档中寻找答案但效果很差我的问题是关于打开关闭和重用连接我在一份文档中找到了这一点客户端可以在不再需要连接时随时关闭连接笔记然而鼓励客户
mySQL：基于不同条件的多个 COUNT()

好吧所以我想做的是根据不同的条件在同一个表上执行不同的 COUNT 而不需要嵌套查询效率或子查询因此可以将其制作成视图这可能吗示例表具有日期列查询应该能够生成固定日期之前和之后的行数计数您正在使用 MySQL 因此您可以利
从 PHP 开发人员的角度来看，MySQL 与 C#

我知道使用 PHP 我可以使用 mysql query sql 和 mysql fetch array 结果获取一些 MySQL 数据并将其放入数组中在 C 中如何实现这一点以便我可以将数据放置在数据网格中这可能是您将看到的填充 D
Android中如何存储大量音频文件？

我正在开发一个需要我播放大量音频文件的应用程序每个文件的大小约为 100KB 目前我有 220 个文件将来可能会增加如果我将这些文件放在 res raw 文件夹中那么我最终会得到一个非常大的 APK 文件在 Android 中存储
我应该为移动网站使用什么文档类型？

我正在从头开始创建网站的移动版本但我不确定应该使用什么文档类型好像没有一个明确的标准是吗在许多移动网站上我看到在其他人身上我发现有人能为我指出正确的移动网页设计方向吗我想支持大多数现代手持设备例如 iPhone
以 15 分钟为间隔排列来自销售人员的呼叫数据

我是 python 和 pandas 以及 stackoverflow 的新手所以我对我提前犯的任何错误表示歉意我有这个数据框 df pd DataFrame data Donald Trump German 2021 9 23 14
执行 ApplicationCommands.Close 时实际发生的情况

我想标题中的问题已经很清楚了当我打电话时会发生什么 ApplicationCommands Close Execute null null 来自我的 viewmodel 类我有一个显示用户控件的模型对话框我有一个命令绑定到用户控件中的
Keras 中的 LSTM 序列预测仅输出输入中的最后一步

我目前正在使用 Keras 使用 Tensorflow 作为后端我有一个 LSTM 序列预测模型如下所示我用它来预测数据系列中的一步输入 30 个步骤每个步骤有 4 个特征输出预测步骤 31 model Sequential m

Keras 中的 LSTM 序列预测仅输出输入中的最后一步

Keras 中的 LSTM 序列预测仅输出输入中的最后一步 的相关文章

随机推荐

热门标签

Keras 中的 LSTM 序列预测仅输出输入中的最后一步的相关文章