Keras：嵌入 LSTM

2024-04-25

在 LSTM 的 keras 示例中，用于对 IMDB 序列数据进行建模（https://github.com/fchollet/keras/blob/master/examples/imdb_lstm.py https://github.com/fchollet/keras/blob/master/examples/imdb_lstm.py），在输入到 LSTM 层之前有一个嵌入层：

model.add(Embedding(max_features,128)) #max_features=20000
model.add(LSTM(128))

嵌入层的真正作用是什么？在这种情况下，这是否意味着 LSTM 层的输入序列的长度是 128？如果是这样，我可以将 LSTM 层写为：

model.add(LSTM(128,input_shape=(128,1))

但也注意到输入X_train已受到pad_sequences加工：

print('Pad sequences (samples x time)')
X_train = sequence.pad_sequences(X_train, maxlen=maxlen) #maxlen=80
X_test = sequence.pad_sequences(X_test, maxlen=maxlen) #maxlen=80

好像输入序列长度是80？

引用文档 https://keras.io/layers/embeddings/#embedding:

将正整数（索引）转换为固定大小的密集向量。例如。 [[4], [20]] -> [[0.25, 0.1], [0.6, -0.2]]

基本上，这会将索引（表示您的 IMDB 评论包含哪些单词）转换为具有给定大小的向量（在您的情况下为 128）。

如果您不知道嵌入是什么，这是维基百科的定义 https://en.wikipedia.org/wiki/Word_embedding:

词嵌入是一组语言建模的统称以及自然语言处理（NLP）中的特征学习技术其中词汇表中的单词或短语被映射到向量低维空间中相对于词汇表的实数大小（“连续空间”）。

回到你问的另一个问题：

在这种情况下，这是否意味着输入序列的长度 LSTM层是128？

不完全的。对于循环网络，您将有一个时间维度和一个特征维度。 128 是你的特征维度，即每个嵌入向量应该有多少个维度。您的示例中的时间维度存储在maxlen，用于生成训练序列。

无论您向 128 提供什么LSTM层是LSTM的实际输出单元数 https://keras.io/layers/recurrent/#lstm.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Keras

LSTM

Embedding

Keras：嵌入 LSTM 的相关文章

简单 CAE 的问题

看起来简单的 CAE 不适用于 Carvana 数据集我正在尝试对 Carvana 数据集进行简单的 CAE 你可以下载它here https www kaggle com c carvana image masking challeng
如何理解SpatialDropout1D以及何时使用它？

偶尔我会看到一些模型正在使用SpatialDropout1D代替Dropout 例如在词性标记神经网络中他们使用 model Sequential model add Embedding s vocabsize EMBED SIZE i
Keras：嵌入/向量的附加层？

我有 3 个词嵌入嵌入 1 w11 w12 w13 w14 嵌入 2 w21 w22 w23 w24 嵌入 3 w31 w32 w33 w34 有没有办法通过添加所有三个向量来获得第四个嵌入并使用所有向量的可训练权重例如嵌入 4 w
Keras 中批量大小可变的batch_dot

我正在尝试编写一个层来合并 2 个张量formula https i stack imgur com I49aj png x 0 和x 1 的形状都是 1 500 M是500 500的矩阵我希望输出为 500 500 我认为这在理论上是可
sigmoid激活函数可以用来解决Keras中的回归问题吗？

我已经用 R 实现了简单的神经网络但这是我第一次用 Keras 实现所以希望得到一些建议我在 Keras 中开发了一个神经网络函数来预测汽车销量数据集可用here https github com allmydatasets dat
Keras IndexError：索引超出范围

我是 Keras 新手我尝试在数据集上执行二进制 MLP 并且不断使索引超出范围但不知道为什么 from keras models import Sequential from keras layers core import Dens
Colab 上没有名为“tensorflow.compat.v2”的模块

我正在关注这个https thebinarynotes com how to train mask r cnn on the custom dataset https thebinarynotes com how to train mask
L-BFGS 是否有 tf.keras.optimizers 实现？

有人有 L BFGS 算法的 Tensorflow 2 tf keras 子类吗如果想使用 L BFGS 目前有两个官方选项 TF概率 SciPy 优化这两个选项使用起来相当麻烦尤其是在使用自定义模型时因此我计划实现 tf k
尝试校准keras模型

我正在尝试通过 Sklearn 实现来校准我的 CNN 模型CalibratedClassifierCV 尝试将其包装为KerasClassifier并覆盖预测功能但没有成功有人可以说我做错了什么吗这是模型代码 def create m
在自定义 keras 层的调用函数中传递附加参数

我创建了一个自定义 keras 层目的是在推理过程中手动更改前一层的激活以下是基本层它只是将激活值乘以一个数字 import numpy as np from keras import backend as K from keras
Tensorflow DecodeJPEG：预期图像（JPEG、PNG 或 GIF）以“\000\000\000\000\000\000\000\00”开头的格式未知

我正在循环浏览图像文件夹这种情况不断发生 tensorflow python framework errors impl InvalidArgumentError 预期的图像 JPEG PNG或GIF 以 000 000 000 000
无法从 DenseVariational 获得合理的结果

我正在尝试使用以下大小的数据集正弦曲线进行回归问题500 首先我尝试使用 2 个密集层每个层有 10 个单元 model tf keras Sequential tf keras layers Dense 10 activation
如何在带有 LSTM 层的 TensorFlow Hub 中使用嵌入模型？

我正在学习 TensorFlow 2 通过 TF Hub 教程进行文本分类它使用了 TF hub 的嵌入模块我想知道是否可以修改模型以包含 LSTM 层这是我尝试过的 train data validation data test d
无法更改现有 Keras 模型中的激活

我有一个普通的 VGG16 模型relu激活即 def VGG 16 weights path None model Sequential model add ZeroPadding2D 1 1 input shape 3 224 224
从 Keras 检查点加载

我正在 Keras 中训练一个模型我使用以下代码保存了所有内容 filepath project model hdh5 checkpoint ModelCheckpoint project model hdf5 monitor loss
如何将两个 keras 模型连接成一个模型？

假设我有一个 ResNet50 模型我希望将该模型的输出层连接到 VGG 模型的输入层这是 ResNet 模型和 ResNet50 的输出张量 img shape 164 164 3 resnet50 model ResNet50 in
batch_size = x.shape[0] AttributeError: 'tuple' 对象没有属性 'shape'

该代码结合图像和掩模进行图像检测我怎样才能纠正这个错误 batch size x shape 0 AttributeError tuple 对象没有属性 shape 这是用于训练的代码 train datagen ImageDataGen
神经网络 - 我的网络似乎训练得很好，但在分类报告中它是完全随机的

我正在训练一个模型来对 3 种类型的车辆进行分类一切看起来都很顺利直到我尝试用我的模型预测任何事情预测结果是完全随机的我使用 3 个类别的 15000 张图像每个类别 5000 个进行训练并使用 3 个类别的 6000 个图像
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
如何在 py_function 之后重塑（图像，标签）数据集

我正在尝试读取自定义映射数据集进行训练但是在使用 py function 映射数据集后我得到了未知的形状例如 def process path file path label get label file path img tf io

随机推荐

通过平移手势或拖动更改视图 Alpha

我想要一个 UIView 在平移手势上拖动到屏幕底部但当它到达屏幕底部时视图 alpha 应该缩小到零反之亦然当我向上拖动视图时 UIView alpha 应缩小到 1 但问题是视图的 Alpha 缩小到零平移一半屏幕时或有时
如何使用新的流 API 在 Dart 中注册自定义事件

我正在尝试注册 CustomEvent https developer mozilla org en US docs DOM Event CustomEvent https developer mozilla org en US docs
原始数据转JPEG格式-JAVA

我尝试使用 JPEGEncoder 将原始数据 ByteArray 转换为 JPEG 格式但在移动设备上速度太慢我已经在移动设备上测试过我怎样才能在java中做同样的事情我将把原始数据字节发送到java并用java将其编码为JPEG
如何解密Lua字节码？

早上好我正在尝试破译 Moon 字节码但我无法以任何方式有人可以帮助我吗我有这个例如 code 27 76 117 97 81 0 1 4 4 4 8 0 如何将此字节码解密为文本我已经在这里搜索 http www asciit
如何使用unix“find”命令查找所有cpp和h文件？

我知道要找到所有 h我需要使用的文件 find name h 但如何找到所有 h AND cpp files find name h print o name cpp print or find name h o name cpp prin
应该是 WebAPI 还是 asmx

我应该为我的两个简单 API 使用 ASMX 服务还是 ASP NET Web API 我想在我的 ASP NET MVC 项目中创建两个简单的 API 一个接受 3 个参数 currentUserID DataType ActionNam
C# 中的类型与强类型

在 C 中有什么理由说强类型与只是typed 当有人说类型化类时我想到的是对象以外的某种类型除了 object 之外几乎所有内容都是用 C 编写的一旦定义了一个不是对象的类该类就是一种类型不再从那里输入它顺便说一句这不是关
为什么两个字符串文字相加不使用operator+？

编辑我已经重新格式化了帖子以使其更加清晰为什么这有效 struct A struct B B A void operator const B const B int main A a1 a2 a1 a2 而这不 struct B B c
排序数组中的最小成本路径

给定一个排序数组A e g 4 9 10 11 19 搬家费用i gt j is abs A j A i 从给定元素开始例如10 找出成本最低的路径而无需两次访问同一元素所以在这个例子中解决方案是10 gt 9 gt 4 gt 11
将图像裁剪或遮罩成圆形

使用 ImageMagick 或 GD 库将图像裁剪或遮罩成圆形形状的最佳方法是什么请注意解决方案存在于其他问答网站上但不存在于 StackOverflow 上这是使用 ImageMagick 的一种方法无需使用遮罩即可实现此
Python 中的归一化互相关

最近几天我一直在努力计算两对向量 x和y 的自由度参考Chelton 1983 它是根据 Chelton 1983 的自由度 https i stack imgur com O0DqE png 我找不到使用 np correlate 计
像随机关卡生成一样自由流动，只有一种可能的解决方案？

我已经实现了在这个问题中标记为正确答案的算法流畅类游戏随机关卡制作用什么 https stackoverflow com questions 12926111 what to use for flow free like game ran
在 Uvicorn/FastAPI 内发出下游 Https 请求的正确方法是什么？

我有一个 API 端点 FastAPI Uvicorn 除此之外它还向另一个 API 请求信息当我使用多个并发请求加载 API 时我开始收到以下错误 h11 util LocalProtocolError can t handle e
如何在创建后将 VB.NET DataTable 列定义为主键

我正在使用 VB NET dataAdapter 从 Oracle 数据库导入表我使用 fill 命令将导入的数据添加到数据集中在 DataTable 已填充数据后如何将 DataTable 的特定列定义为 PrimaryKey 只要
灵活地将新数据附加到 yaml 文件

我有不同的 yaml 文件它们可能具有不同的嵌套结构文件1 yaml test3 service1 name1 somedata name2 somedata 文件2 yaml test1 app1 app2 somedata app7
在远程服务器上执行 rake 任务

生产环境的物理架构包括多台执行不同作业 rake 任务的机器所有这些机器都在同一个数据库上其中一项工作将完成大量工作UPDATE如果其他作业正在运行则通常会返回 postgres 死锁的表我已经有一个 rake 任务来正常停止其他
如何对字符串进行拼写检查？

有人知道 C 多语言拼写检查库吗我不需要实时拼写检查仅检查字符串 thanks 就其价值而言这是谷歌上的第一个点击 SpellCheck http msdn microsoft com en us library system win
如何在本地闭包中调用非逃逸闭包？ [复制]

这个问题在这里已经有答案了我有一个看起来像这样的函数 func test closure gt let localClosure closure localClosure 这只是一个例子并不能完全反映我遇到的问题显然在这里我可以直接打
类型错误：“str”对象无法使用 input() 调用[重复]

这个问题在这里已经有答案了我有以下代码它应该询问用户 2 文件名我在第二个函数中的 input 中遇到错误但在第一个函数中没有我不明白这是错误输出 getOutputFile 文件 splitRAW py 第 22 行位于
Keras：嵌入 LSTM

在 LSTM 的 keras 示例中用于对 IMDB 序列数据进行建模 https github com fchollet keras blob master examples imdb lstm py https github com

Keras：嵌入 LSTM

Keras：嵌入 LSTM 的相关文章

随机推荐

热门标签