来自数据帧的神经网络 LSTM 输入形状

2023-12-22

我正在尝试实施一个LSTM 与 Keras https://keras.io/layers/recurrent/#lstm.

我知道 Keras 中的 LSTM 需要具有形状的 3D 张量(nb_samples, timesteps, input_dim)作为输入。但是，我并不完全确定在我的情况下输入应该是什么样子，因为我只有一个样本T每个输入的观察结果，而不是多个样本，即(nb_samples=1, timesteps=T, input_dim=N)。将我的每个输入分成长度样本是否更好T/M? T对我来说大约有几百万个观察值，所以在这种情况下每个样本应该多长，即我将如何选择M?

另外，我是否正确，这个张量应该类似于：

[[[a_11, a_12, ..., a_1M], [a_21, a_22, ..., a_2M], ..., [a_N1, a_N2, ..., a_NM]], 
 [[b_11, b_12, ..., b_1M], [b_21, b_22, ..., b_2M], ..., [b_N1, b_N2, ..., b_NM]], 
 ..., 
 [[x_11, x_12, ..., a_1M], [x_21, x_22, ..., x_2M], ..., [x_N1, x_N2, ..., x_NM]]]

其中 M 和 N 定义如前，x 对应于我从上面讨论的拆分中获得的最后一个样本？

最后，给定一个 pandas 数据框T每列中的观察值，以及N列，每个输入一个，我如何创建这样一个输入来提供给 Keras？

下面是一个设置时间序列数据来训练 LSTM 的示例。模型输出毫无意义，因为我设置它只是为了演示如何构建模型。

import pandas as pd
import numpy as np
# Get some time series data
df = pd.read_csv("https://raw.githubusercontent.com/plotly/datasets/master/timeseries.csv")
df.head()

时间序列数据框：

Date      A       B       C      D      E      F      G
0   2008-03-18  24.68  164.93  114.73  26.27  19.21  28.87  63.44
1   2008-03-19  24.18  164.89  114.75  26.22  19.07  27.76  59.98
2   2008-03-20  23.99  164.63  115.04  25.78  19.01  27.04  59.61
3   2008-03-25  24.14  163.92  114.85  27.41  19.61  27.84  59.41
4   2008-03-26  24.44  163.45  114.84  26.86  19.53  28.02  60.09

您可以将输入构建到向量中，然后使用 pandas.cumsum()构建时间序列序列的函数：

# Put your inputs into a single list
df['single_input_vector'] = df[input_cols].apply(tuple, axis=1).apply(list)
# Double-encapsulate list so that you can sum it in the next step and keep time steps as separate elements
df['single_input_vector'] = df.single_input_vector.apply(lambda x: [list(x)])
# Use .cumsum() to include previous row vectors in the current row list of vectors
df['cumulative_input_vectors'] = df.single_input_vector.cumsum()

可以用类似的方式设置输出，但它将是单个向量而不是序列：

# If your output is multi-dimensional, you need to capture those dimensions in one object
# If your output is a single dimension, this step may be unnecessary
df['output_vector'] = df[output_cols].apply(tuple, axis=1).apply(list)

输入序列的长度必须相同才能在模型中运行，因此您需要将它们填充为累积向量的最大长度：

# Pad your sequences so they are the same length
from keras.preprocessing.sequence import pad_sequences

max_sequence_length = df.cumulative_input_vectors.apply(len).max()
# Save it as a list   
padded_sequences = pad_sequences(df.cumulative_input_vectors.tolist(), max_sequence_length).tolist()
df['padded_input_vectors'] = pd.Series(padded_sequences).apply(np.asarray)

训练数据可以从数据框中提取并放入 numpy 数组中。请注意，来自数据帧的输入数据不会形成 3D 数组。它创建了一个数组的数组，这不是一回事。

您可以使用 hstack 和 reshape 来构建 3D 输入数组。

# Extract your training data
X_train_init = np.asarray(df.padded_input_vectors)
# Use hstack to and reshape to make the inputs a 3d vector
X_train = np.hstack(X_train_init).reshape(len(df),max_sequence_length,len(input_cols))
y_train = np.hstack(np.asarray(df.output_vector)).reshape(len(df),len(output_cols))

为了证明这一点：

>>> print(X_train_init.shape)
(11,)
>>> print(X_train.shape)
(11, 11, 6)
>>> print(X_train == X_train_init)
False

获得训练数据后，您可以定义输入层和输出层的维度。

# Get your input dimensions
# Input length is the length for one input sequence (i.e. the number of rows for your sample)
# Input dim is the number of dimensions in one input vector (i.e. number of input columns)
input_length = X_train.shape[1]
input_dim = X_train.shape[2]
# Output dimensions is the shape of a single output vector
# In this case it's just 1, but it could be more
output_dim = len(y_train[0])

构建模型：

from keras.models import Model, Sequential
from keras.layers import LSTM, Dense

# Build the model
model = Sequential()

# I arbitrarily picked the output dimensions as 4
model.add(LSTM(4, input_dim = input_dim, input_length = input_length))
# The max output value is > 1 so relu is used as final activation.
model.add(Dense(output_dim, activation='relu'))

model.compile(loss='mean_squared_error',
              optimizer='sgd',
              metrics=['accuracy'])

最后，您可以训练模型并将训练日志保存为历史记录：

# Set batch_size to 7 to show that it doesn't have to be a factor or multiple of your sample size
history = model.fit(X_train, y_train,
              batch_size=7, nb_epoch=3,
              verbose = 1)

Output:

Epoch 1/3
11/11 [==============================] - 0s - loss: 3498.5756 - acc: 0.0000e+00     
Epoch 2/3
11/11 [==============================] - 0s - loss: 3498.5755 - acc: 0.0000e+00     
Epoch 3/3
11/11 [==============================] - 0s - loss: 3498.5757 - acc: 0.0000e+00

就是这样。使用model.predict(X) where X格式相同（样本数量除外）X_train以便根据模型进行预测。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

来自数据帧的神经网络 LSTM 输入形状的相关文章

如何同时运行多个功能[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有以下代码 my func1 my func2 my func3 my func4 my func5 是否可以同时计算函数的数据而
使用管理员权限打开cmd（Windows 10）

我有自己的 python 脚本来管理我的计算机上的 IP 地址它主要在命令行 Windows 10 中执行netsh命令您必须具有管理员权限这是我自己的计算机我是管理员运行脚本时我已经使用管理员类型的用户 Adrian 登录我无
如何通过 python 中的函数运行列表？

我试图通过我创建的函数运行我的列表但不断收到错误我不知道出了什么问题温度 F temp f 19 21 21 21 23 功能 def fahrToCelsius tempFahrenheit return tempFahrenhei
使用 Boto3 超时的 AWS Lambda 函数

我已经解决了我自己的问题但无论如何我都会发布它希望能节省其他人几个小时我在 AWS 上有一个无服务器项目使用 Python 将记录插入到 kinesis 队列中但是当我使用 boto3 client kinesis 或 put
Python3将模块从文件夹导入到另一个文件夹

我的结构字典是 mainFolder folder1 init py file1 py file2 py folder2 init py file3 py file4 py setup py init py 我需要将 file4 py 从f
Python Selenium 打印另存为 PDF 等待文件名输入

我正在尝试通过打印对话框将网站另存为 PDF 我的代码允许我另存为pdf 但要求我输入文件名我不知道如何将文件名传递到弹出框附上我的代码 import time from selenium import webdriver import
Python speedtest.net，或等效的[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案是否有一个 Python 库可以实现 SpeedTest net 测试或等效的互联网连接速度测试 GitHub上有一个项目叫速度检查 https gi
使用 scikit 时 scipy.sparse 矩阵的缩放问题

在使用 scikit learn 解决机器学习问题时我需要在使用 SVM 进行训练之前对 scipy sparse 矩阵进行缩放但在文档 http scikit learn org stable modules preprocessin
使用 python 脚本更改 shell 中的工作目录

我想实现一个用户态命令它将采用其参数之一路径并将目录更改为该目录程序完成后我希望 shell 位于该目录中所以我想实施cd命令但需要外部程序可以在 python 脚本中完成还是我必须编写 bash 包装器 Example t
Pandas 合并指标自定义值

在 pandas 合并期间将指示器更新为更友好的消息的最快方法是什么默认indicator True yields left only right only both 我想更新为Only present in last month s d
使用 ElementTree 在 python 中解析 xml

我对 python 很陌生我需要解析一些脏的 xml 文件这些文件需要先清理我有以下 python 代码 import arff import xml etree ElementTree import re totstring wit
Snakemake：将多个输入用于具有多个子组的一个输出的规则

我有一个工作管道用于下载比对和对公共测序数据执行变体调用问题是它目前只能在每个样本的基础上工作 i e作为每个单独测序实验的样本如果我想对一组实验例如样本的生物和或技术复制执行变体调用则它不起作用我试图解决它但我无法让它
将图与热图（可能是对数）配对？

How to create a pair plot in Python like the following but with heat maps instead of points or instead of a hex bin plot
将 Django 中的所有视图限制为经过身份验证的用户

我是 Django 新手我正在开发一个项目该项目有一个登录页面作为其索引和一个注册页面其余页面都必须仅限于登录用户如果未经身份验证的用户尝试访问这些页面则必须将他她重定向到登录页面我看到 login required装饰器会将
如何检测一个二维数组是否在另一个二维数组内？

因此在堆栈溢出成员的帮助下我得到了以下代码 data needle s which is a png image base64 code goes here decoded data decode base64 f cStringIO
tf.print() vs Python print vs tensor.eval()

看来在Tensorflow中至少有三种方法可以打印出张量的值我一直在读here https www freecodecamp org news debugging tensorflow a starter e6668ce72617 an
为什么从 openAI 导入 Universe 模块时出现“无效语法”错误

当我导入时universe来自 openAI 的模块我收到以下错误 Traceback most recent call last File
PyQt5按钮lambda变量变成布尔值[重复]

这个问题在这里已经有答案了当我运行下面的代码时它显示如下为什么 x 不是 x 而是变成布尔值这种情况仅发生在传递到用 lambda 调用的函数中的第一个参数上错误的 y home me model some file from P
Chrome 驱动程序和 Chromium 二进制文件无法在 aws lambda 上运行

我陷入了一个问题我需要在 AWS lambda 上做一些抓取工作所以我按照下面提到的博客及其代码库作为起点这非常有帮助并且在运行时环境 Python 3 6 的 AWS lambda 上对我来说工作得很好 https manivan
从 Django 运行 shell 命令

我正在 Django 中开发一个网页使用 apache 服务器需要调用 shell 命令来启用禁用一些守护进程我尝试这样做 os system service httpd restart 1 gt HOME out 2 gt HOM

随机推荐

如何用正确的行数填充表格以适应不同屏幕分辨率下的页面高度？

我在前端开发了自己的网络管理这是一个典型的 Admin 其中包含容器左侧的一个菜单导航和右侧的正文内容其中显示与单击的菜单项相关的结果通常是表格为了以 100 适合正文页面获得表格中正确的行数或行数的最佳方法是什么就我而言我
如何使用 Azure DevOps REST API 更新文件？

我正在尝试更新test json文件托管在 Azure DevOps Repo 上我正在使用逻辑应用程序无法从文档中识别操作顺序我想我需要向以下地址发出 GET HTTP 请求Items端点 https learn microsof
PhpStorm 终端：Cygwin 颜色不起作用

我有 PhpStorm 2016 2 并在 Shell 路径中添加了 Cygwin 如下所示 C cygwin64 bin env exe CHERE INVOKING 1 bin bash exe 它运行良好但颜色不起作用例如我有 3
EntityNotFoundException：Bean 已被删除 - 延迟加载失败

我正在迈出 Play 的第一步使用 Java 的框架 v2 1 rc1 现在我遇到了 ebean 的第一个问题我有一个与其自身具有多对一关系的导航实体当我尝试访问parentNavigation中的标题字段时我收到以下错误 Enti
通过 SSH 连接到位于 VPC 私有子网中的 AWS EC2 实例

我已经研究这个问题几个小时了也许这是不可能的也许是不可能的我在 AWS 中有一个 VPC 带有几个 EC2 实例和 Lambda 实例截至目前 lambda 可以毫无问题地调用 ssh 等连接 EC2 服务器我的 lambda 在
自动初始化 Typescript 中字符串文字类型的成员字段

如果我有课的话 class Foo type foo constructor public id number class Bar type bar constructor public id number type SomeUnion F
Java：JVM 可用的内核？

Java中有这样的方法Runtime getRuntime availableProcessors 其中有以下 Javadoc 返回 Java 虚拟机可用的处理器数量该值可能会在虚拟机的特定调用期间发生变化价值实际上如何改变例如在什
Grails 将请求参数绑定到枚举

我的 Grails 应用程序有大量的枚举如下所示 public enum Rating BEST be GOOD go AVERAGE av BAD ba WORST wo final String id private RateType
使用 Json.Net C# 获取 json 对象中的值和键

你好我的 json 看起来像这样 Id 357342524563456678 title Person language eng questionAnswer 4534538254745646 1 firstName Janet ques
自适应图标不起作用

显现
从用户控件/类/页面访问母版页公共方法

我要访问我的母版页上的方法我有一个错误标签我想根据从我的网站收到的错误消息来更新该标签 public string ErrorText get return this infoLabel Text set this infoLabel
我的应用程序“包含加密”吗？

我是第一次上传二进制文件 iTunes Connect 问我出口法要求包含加密的产品获得适当的出口授权不遵守规定可能会导致严厉的处罚更多信息请点击这里您的产品包含加密吗 I use https 但只能通过NSURLConnecti
仅分包按需进口申报

有关的当没有这样的类时如何使用 ant javac 编译 import pack https stackoverflow com questions 878685 how can i compile import pack with a
Django admin is_staff 基于组

是否可以通过选择组来选择is staff 假设有两个组用户管理员当新用户在 users 组中时他不是员工但如果他在 admins 组中他就是员工有一种简单的方法可以在您的用户模型中定义以下内容 property def is
Android：无法在同一手机上执行通过Linux Deploy编译的文件

root hammerhead data local HelloWorld tmp mksh HelloWorld No such file or directory Hello 我在 Linux Deploy 上使用 gcc 进行编译据
如何使用软断言来避免测试运行执行失败

我想继续测试运行执行即使一个或多个断言失败TestNG 我引用了下面的链接来实施soft assertion在我的项目中 http beust com weblog 2012 07 29 reinventing assertions ht
为什么缩减部署似乎总是会删除最新的 Pod？

在开始之前我在 Windows 10 上使用 minikube v27 我已经使用 nginx hello world 容器创建了一个部署所需计数为 2 实际上我进入了 2 小时的旧 pod 并将 index html 文件从欢迎消
javafx.scene.layout.Pane 无法转换为 javafx.fxml.FXMLLoader

我在尝试从一个场景切换到另一个场景时遇到问题场景是这样的当前视图和控制器 login fxml and LoginController 下一步视图和控制器 loggedWindow fxml and UserPanelControlle
为什么我在使用 primefaces 时却使用omnifaces？

我需要知道使用 OmniFaces 与我目前使用的 PrimeFaces 相比有什么好处 OmniFaces 提供哪些 PrimeFaces 不提供的功能它们是不同的东西你可以完美地将它们结合起来 Omnifaces 是 JSF 的一个
来自数据帧的神经网络 LSTM 输入形状

我正在尝试实施一个LSTM 与 Keras https keras io layers recurrent lstm 我知道 Keras 中的 LSTM 需要具有形状的 3D 张量 nb samples timesteps input di

来自数据帧的神经网络 LSTM 输入形状

来自数据帧的神经网络 LSTM 输入形状 的相关文章

随机推荐

热门标签

来自数据帧的神经网络 LSTM 输入形状的相关文章