如何组织循环神经网络？

2024-05-11

我想模拟以下内容：

y(t)=F(x(t-1),x(t-2),...x(t-k))

或者说一个函数，其当前输出取决于最后 k 个输入。

1-我知道一种方法是使用一个经典的神经网络，其中 k 个输入为{x(t-1),x(t-2),...x(t-k)}对于每个y(t)并训练它。那么使用 RNN 来解决这个问题有什么好处呢？

2-假设使用RNN，我应该只使用x(t)（或x(t-1)）并假设隐藏层可以通过输入找到y(t)与过去k个输入的关系它的内存（隐藏层）？

3-考虑到我们想要根据最后 k 个输入来估计输出，使用像 Deep RNN 或 LSTM 这样的深度网络对于此类问题有什么优越的好处吗？

我不会建议您使用经典的普通 RNN。理论上，它能够将先前输入的信息存储在内存中，但实际上它需要大量的节点。
假设经典的普通实现与现代架构（例如 LSTM 或 GRU）一样长 - 这取决于您是否想使用一种定向模型或双向模型。如果您想预测下一步 - 通常一个定向架构更好。如果您想更好地分析给定的序列 - 我建议您应用双向序列。
LSTM 和 GRU 使用额外的内存单元，帮助您保持内存中输入之间的长时间依赖性。它们被认为是目前最好的架构。深度 RNN - 通常是具有循环拓扑的深度网络 - 它们以与前馈神经网络相同的方式利用其深度。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

neuralnetwork

deeplearning

recurrentneuralnetwork

如何组织循环神经网络？的相关文章

不确定我的自动编码器神经网络从 Keras 预测中给出的结果

我正在尝试构建一个自动编码器神经网络用于在单列文本列表中查找异常值我的输入有 138 行它们看起来像这样 amaze header 2 png amaze header png circle shape xml disableable
使用 LSTM 进行时间序列模式识别(python)

我的应用场景和上一个类似时间序列中的模式识别 https stackoverflow com questions 11752727 pattern recognition in time series By processing a tim
Mobilenet 与 SSD [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案
使用预训练（Tensorflow）CNN 提取特征

深度学习已成功应用于多个大型数据集用于对少数类别猫狗汽车飞机等进行分类其性能优于 SIFT 特征袋颜色直方图等更简单的描述符然而训练这样的网络需要每个类别大量的数据和大量的训练时间然而在花时间设计和训练这样一种设备并
Tensorflow 2.0 中的二阶导数

我正在尝试计算标量变量的简单向量函数的二阶导数f x x x 2 x 3 使用 TF 2 3 与tf GradientTape def f ab x return x x 2 x 3 import tensorflow as tf in1
如何以干净高效的方式在 pytorch 中获得小批量？

我试图做一件简单的事情即使用火炬通过随机梯度下降 SGD 训练线性模型 import numpy as np import torch from torch autograd import Variable import pdb def
每次运行神经网络代码时结果都会改变

我通过运行此链接中提供的代码得到了结果神经网络预测多个变量的值 https stackoverflow com questions 58071836 neural network predicting values of multiple
如何在 Tensorflow 对象检测 api 中评估预训练模型

尝试使用最近发布的 Tensorflow 对象检测 API 并且想知道如何评估他们在模型动物园中提供的预训练模型之一前任如何获取该预训练模型的 mAP 值自从script https github com tensorflow mod
“Dense”对象没有属性“op”[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我正在尝试使用tensorflow keras制作一个完全连接的模型这是我的代码 from tensorflow keras m
打印出网络架构中每一层的形状

在 Keras 中我们可以如下定义网络有什么办法可以输出每层之后的形状例如我想打印出以下形状inputs在定义行之后inputs 然后打印出形状conv1在定义行之后conv1 etc inputs Input 1 img rows
为什么反向传播神经网络中必须使用非线性激活函数？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我一直在阅读一些有关神经网络的内容并且了解单层神经网络的一般原理我理解需要额外的层但为什么要使用非线性激活函数这个问题后面跟着这个
深度学习——一些关于caffe的幼稚问题

我试图了解 caffe 的基础知识特别是与 python 一起使用我的理解是模型定义比如给定的神经网络架构必须包含在 prototxt file 当您使用数据训练模型时 prototxt 您将权重模型参数保存到 caffemode
什么是 ANN 中的纪元以及它如何转换为 MATLAB 中的代码？

我试图理解并可视化训练人工神经网络的时代到底是什么我们有一个包含约 7000 个产品的训练集其中有 10 个特征输入这些产品必须根据这 10 个输入分为 7 个类别我们的 ANN 有 10 个输入这些输入进入由 10 个神经
如何在pytorch中动态索引张量？

例如我有一个张量 tensor torch rand 12 512 768 我得到了一个索引列表说它是 0 2 3 400 5 32 7 8 321 107 100 511 我希望从给定索引列表的维度 2 上的 512 个元素中选择 1
使 pycaffe 致命错误：找不到“Python.h”文件

我在运行 OSX 10 9 5 的 Mac 上编译了 caffe 并且我知道尝试编译 pycaffe 当我在 caffe 根文件夹中运行 make pycaffe 时我得到 CXX LD o python caffe caffe so p
根据caffe中的“badness”缩放损失值

我想根据训练期间当前预测与正确标签的接近远近来缩放每个图像的损失值例如如果正确的标签是猫而网络认为它是狗那么惩罚损失应该小于网络认为它是汽车的情况我正在做的方式如下 1 我定义了标签之间距离的矩阵 2 将该矩
将 Pytorch 模型 .pth 转换为 onnx 模型

我有一个预训练的模型其格式为 pth 扩展名我想将其转换为 Tensorflow protobuf 但我没有找到任何方法来做到这一点我见过 onnx 可以将模型从 pytorch 转换为 onnx 然后从 onnx 转换为 Tenso
预处理 csv 文件以与 tflearn 一起使用

我的问题是关于在将 csv 文件输入神经网络之前对其进行预处理我想使用 python 3 中的 tflearn 为著名的 iris 数据集构建一个深度神经网络数据集 http archive ics uci edu ml machine
使用tensorflow获取真阳性、假阳性、假阴性和真阴性列表

这是我的工作我注释了活细胞的图像约 8 000 和死细胞的图像约 2 000 800 和 200 用于测试集我正在使用 CNN 带有张量流和 keras 将图像分类为活或死我训练了我的模型验证损失 0 35 召回率
如何在 Detectron2 中计算并集交集？

我正在使用 Detectron2 进行对象检测我已经注册了 pascalvoc 数据集并训练了一个检测模型如何计算测试数据集的平均 IOU 我知道 detector2 有一个用于计算 IOU 的预定义函数即 detectorron2

随机推荐

AWS Cognito - 如何确定用户是否使用电子邮件或电话号码注册

我们已经按照描述实施了自定义身份验证触发器here https docs aws amazon com cognito latest developerguide user pool lambda challenge html 我们设置了用
您认为 ASP.NET MVC 会与 ASP.NET Webforms 竞争吗？

您认为 ASP NET MVC 会在 Microsoft Web 开发市场中占据重要份额吗还是会占市场的 10 15 哦是的它将让 Web 表单脱颖而出我们已经看到了真正的 MVC 框架在 Java 世界中的价值在 MS 世界中这
模板与非模板类，跨编译器的不同行为

我在一些应用程序中使用编译时计数器它确实很有用昨天我想用 gcc 编译一个程序我之前使用的是 msvc 并且计数器的行为在模板类中发生了变化它在模板类中不再工作过于简化的代码 Maximum value the counter c
允许在 Safari 上聊天应用程序使用 audio.play()

由于苹果禁用了自动播放音频的功能HTMLMedia Element play https developer mozilla org en US docs Web API HTMLMediaElement play在没有用户交互的 java
为什么我们在同一台服务器上使用多个应用程序服务器实例

我想这是有充分理由的但我不明白为什么有时我们会在同一物理服务器上放置例如 5 个具有相同 Web 应用程序的实例这与多处理器架构的优化有关吗 JVM 或其他允许的最大内存限制嗯过了很长一段时间我又看到这个问题了一台机器上的多个 J
java.lang.NoClassDefFoundError: org/apache/commons/cli/ParseException

我想将 apache cli 添加到我的应用程序中但我有问题当我尝试运行它时显示这些错误 Error A JNI error has occurred please check your installation and try aga
PyCharm：安装包失败

我需要安装一些软件包无论我尝试哪个方向情况只会变得更糟请帮忙 40 497 执行错误目录 Users doekewartena Library Caches pip http 或其父目录不属于当前用户并且缓存已被禁用请检查该目录
Cypress.io 如何处理异步代码

我正在将旧的水豚测试转移到 cypress io 因为我们的应用程序正在采用 SPA 方式在我们的案例中我们有超过 2000 个测试涵盖了很多功能因此测试功能的常见模式是让用户创建并发布报价一开始我写了 cypress 浏览页面
将我的自定义模型绑定到我的 POST 控制器

我正在使用最近发布的 MVC 4 Beta 4 0 20126 16343 并且正在努力解决反序列化模型绑定不适用于数组的已知问题请参阅此处堆栈溢出 https stackoverflow com questions 9592838 d
未使用的功能会产生什么后果

我想知道在代码中使用未使用的函数会产生什么如果有什么后果如果您查找并删除所有未使用的函数和变量性能是否会有明显的改进或者删除未使用的函数和变量只是一个好习惯未使用的功能不会损害性能他们让维护代码的人的工作变得更加困难现代 ID
了解字典的深度

假设我们有这个字典 d a 1 b c 了解嵌套的最直接方法是什么depth of it 您需要创建一个递归函数 gt gt gt def depth d if isinstance d dict return 1 max map dept
Guava MultiSet 与 Map？

我对Multiset的理解是一个带有频率的集合但是我总是可以使用Map来表示频率还有其他原因使用Multiset吗优点Multiset
将参数传递给调试器中的 perl 文件并在系统执行的文件中设置断点

因此我使用 perl d file pl 在 perl 调试器中运行一个文件但 file pl 也应该接受参数如何向 file pl 提供参数还有一个问题 file pl 中有这一行 system file2 pl 如果 file2
Facebook 异常 #100：无法解析为有效的用户 ID

尝试使用 PHP 发布到用户的 facebook 墙时我收到错误 error type OAuthException message 100 http spats in nssc2 does not resolve to a valid
NodeJS 错误堆栈未定义 [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我正在使用节点检查器我注意到new Error 有未定义的堆栈如果我将此值分配给一个变量该变量将显示堆栈未定义有趣的是跑步new
如何在 asp.net mvc 4 中使用 signalr v2 beta

v2 之前 RouteTable Routes MapHubs 在 v2 中 MapHubs 不再存在 wiki 说添加一个 Startup 类和一个 Configuration 方法以及对 app MapHubs 的调用 namespac
Java并发锁和条件的使用

我可以用object wait object notify and synchronized blocks解决生产者消费者类型的问题同时我可以使用locks and conditions from java util concurrent
如何加载具有可变文件名的 .mat 文件？

select all mat files oar dir oar mat n oar name loop through files for l 1 length oar load pat oar l lt this is the mat
如何将模型从 ML Pipeline 保存到 S3 或 HDFS？

我正在尝试保存 ML Pipeline 生成的数千个模型正如答案中所示here https stackoverflow com questions 32121046 run 3000 random forest models by gro
如何组织循环神经网络？

我想模拟以下内容 y t F x t 1 x t 2 x t k 或者说一个函数其当前输出取决于最后 k 个输入 1 我知道一种方法是使用一个经典的神经网络其中 k 个输入为 x t 1 x t 2 x t k 对于每个y t 并训练它

如何组织循环神经网络？

如何组织循环神经网络？ 的相关文章

随机推荐

热门标签

如何组织循环神经网络？的相关文章