如何理解SpatialDropout1D以及何时使用它？

2024-05-26

偶尔我会看到一些模型正在使用SpatialDropout1D代替Dropout。例如，在词性标记神经网络中，他们使用：

model = Sequential()
model.add(Embedding(s_vocabsize, EMBED_SIZE,
                    input_length=MAX_SEQLEN))
model.add(SpatialDropout1D(0.2)) ##This
model.add(GRU(HIDDEN_SIZE, dropout=0.2, recurrent_dropout=0.2))
model.add(RepeatVector(MAX_SEQLEN))
model.add(GRU(HIDDEN_SIZE, return_sequences=True))
model.add(TimeDistributed(Dense(t_vocabsize)))
model.add(Activation("softmax"))

根据 Keras 的文档，它说：

该版本执行与 Dropout 相同的功能，但它会丢弃整个一维特征图而不是单个元素。

但是，我无法理解其含义输入一维特征。更具体地说，我无法想象SpatialDropout1D在同一模型中解释quora https://www.quora.com/How-does-the-dropout-method-work-in-deep-learning-And-why-is-it-claimed-to-be-an-effective-trick-to-improve-your-network。有人可以使用与 quora 中相同的模型来解释这个概念吗？

另外，我们在什么情况下会使用SpatialDropout1D代替Dropout?

为了简单起见，我首先要指出的是，所谓的特征图（1D、2D 等）是我们的常规通道。让我们看一下例子：

Dropout()：我们定义 2D 输入：[[1, 1, 1], [2, 2, 2]]。 Dropout 将独立考虑每个元素，并可能导致类似 [[1, 0, 1], [0, 2, 2]] 的结果
SpatialDropout1D()：在这种情况下，结果将类似于 [[1, 0, 1], [2, 0, 2]]。请注意，第二个元素已被归零all渠道。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

Keras

deeplearning

convneuralnetwork

dropout

如何理解SpatialDropout1D以及何时使用它？的相关文章

keras LSTM 以正确的形状提供输入

我从具有以下形状的 pandas 数据框中获取一些数据 df head gt gt gt Value USD Drop 7 Up 7 Mean Change 7 Change Predict 0 06480 2 0 4 0 0 000429
在逻辑回归中使用排名数据

当我努力学习这些概念时我将对此给予最大赏金我正在尝试在逻辑回归中使用一些排名数据我想使用机器学习来制作一个简单的分类器来判断网页是否好这只是一个学习练习所以我不期望有很好的结果只是希望学习过程和编码技术我已将数据放入 c
深度学习——一些关于caffe的幼稚问题

我试图了解 caffe 的基础知识特别是与 python 一起使用我的理解是模型定义比如给定的神经网络架构必须包含在 prototxt file 当您使用数据训练模型时 prototxt 您将权重模型参数保存到 caffemode
在 GPU 上训练时如何处理非确定性？

在调整超参数以使模型性能更好时我注意到每次运行代码时获得的分数以及创建的模型都是不同的尽管修复了随机操作的所有种子如果我在CPU上运行就不会出现这个问题我搜索了一下发现这是使用 GPU 训练时的常见问题这是一个非常好的详细
sklearn：如何在 sknn 中重置回归器或分类器对象

我定义了一个回归器如下所示 nn1 Regressor layers Layer Rectifier units 150 Layer Rectifier units 100 Layer Linear regularize L2 dropo
Keras：加载多个模型并在不同线程中进行预测

我正在使用带有张量流核心的 Keras 我想在构造函数中加载 2 个不同的模型然后在不同的线程中进行预测根据请求我尝试在张量流图上下文中加载这些模型但它不起作用我的代码 from keras models import load
如何组合多个朴素贝叶斯分类器的输出？

我是新来的我有一组使用 Sklearn 工具包中的朴素贝叶斯分类器 NBC 构建的弱分类器我的问题是如何结合每个 NBC 的输出来做出最终决定我希望我的决定是基于概率而不是标签我用 python 编写了以下程序我假设 sklean
具有高级计算功能的 Keras 自定义层

我想写一些自定义的Keras分层并在层中进行一些高级计算例如使用 Numpy Scikit OpenCV 我知道有一些数学函数keras backend可以对张量进行操作但我需要一些更高级的功能但是我不知道如何正确实现这一点我收到
在Python中表示语料库句子的一种热门编码

我是 Python 和 Scikit learn 库的初学者我目前需要从事一个 NLP 项目该项目首先需要通过 One Hot Encoding 来表示一个大型语料库我已经阅读了 Scikit learn 关于 preprocessi
使用 flow_from_dataframe y_col 的正确“值”是什么

我正在用 pandas 读取 csv 文件并给出存储在中的列名称colname colnames file label Read data from file data pd read csv Hand Annotations 2 csv
从 Keras 检查点加载

我正在 Keras 中训练一个模型我使用以下代码保存了所有内容 filepath project model hdh5 checkpoint ModelCheckpoint project model hdf5 monitor loss
使用 Keras Tuner 调整模型时如何跳过有问题的超参数组合？

使用 Keras Tuner 时似乎没有办法允许跳过有问题的超参数组合例如 Conv1D 层中的过滤器数量可能与后续 MaxPooling1D 层中的池大小的所有值不兼容从而导致模型构建错误然而在运行调谐器之前可能不知道这一点一
如何使用DecisionTreeClassifier平衡分类？

我有一个数据集其中类别不平衡课程是0 1 or 2 如何计算每个类别的预测误差然后重新平衡weights相应地在 scikit learn 中如果您想完全平衡将每个类别视为同等重要您可以简单地通过class weight bala
将列指定为多个组合回归模型中的特征和标签 (ML.NET)

我正在使用 ML NET 使用回归模型来预测一系列值我只对预测的一列分数列感兴趣但是其他一些列的值不可用于预测类我不能将它们保留为 0 因为这会扰乱预测所以我想它们也必须被预测我看到一个类似的问题here https sta
conv1D 中形状的尺寸

我尝试过构建一个只有一层的 CNN 但遇到了一些问题事实上编译器告诉我 ValueError 检查模型输入时出错预期的 conv1d 1 input 具有 3 个维度但得到形状为 569 30 的数组这是代码 import num
batch_size = x.shape[0] AttributeError: 'tuple' 对象没有属性 'shape'

该代码结合图像和掩模进行图像检测我怎样才能纠正这个错误 batch size x shape 0 AttributeError tuple 对象没有属性 shape 这是用于训练的代码 train datagen ImageDataGen
朴素贝叶斯分类器仅基于先验概率做出决策

我试图根据推文的情绪将推文分为三类买入持有卖出我正在使用 R 和包 e1071 我有两个数据框一个训练集和一组需要预测情绪的新推文训练集数据框 text sentiment this stock is a good buy Bu
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
如何在 Tensorflow Keras 中规范化我的图像数据

如前所述我正在尝试在训练模型之前标准化我的数据集我正在使用tf keras preprocessing image ImageDataGenerator之前执行此操作 train data tf cast train data tf f

随机推荐

当我的 Login.aspx 不在应用程序的根目录中时，如何使用 ASP.NET 登录控件？

我正在使用ASP NET 登录控件 http msdn microsoft com en us library ms178329 aspx and 表单验证 http msdn microsoft com en us library aa4
如何预设属性中未定义的 MSI SecureCustomProperties 以允许静默安装？

特定供应商的 MSI 通常通过 EXE 包装器安装但我尝试通过 GPO 使用静默安装进行部署我正在努力预设 SecureCustomProperties 供应商记录了可以传递给 EXE 包装器的大写命令行选项我假设它会将它们传递给 M
如何将 php 变量传递给 ajax

我有一个自动加载页面我需要能够基于变量检索数据因为该变量必须返回特定值下面的代码基于检索所有数据但我只需要基于 list 的少数数据 Page php
无法使用 Git Bash 对 Visual Studio Team Services 进行身份验证

由于身份验证失败我无法对 Visual Studio Team Services VSTS 上的远程存储库运行任何命令我可以通过 Visual Studio 进行拉取等操作但只能通过 Visual Studio 不通过 Git Bas
模板内定义的友元函数的实例化

这是后续的这个问题 https stackoverflow com q 67305642 4117728 最初的案例是另外一回事但在我写出一个糟糕的答案和OP澄清的过程中事实证明我们可能需要语言律师的帮助来理解发生了什么在 Think
不使用 Magento Connect 安装 magento 插件

我有一个我的客户购买的插件它是一个 zip 文件如何在不使用 Magento 连接的情况下安装插件通常你可以直接解压但你应该检查目录结构是Magento风格它至少应该有app code app etc modules目录
React Native 输入组件仅接受数值

在React Native项目中我有一个来自Native Base的输入组件我希望这个组件只接受数值0 9并给这个字段默认值我寻找了关于这个问题的其他问题我不知道也许那些答案是针对 textInput 组件的或者不知何故建议对我不
Mercurial日志接口

我一直在浏览 hginit com 上的教程但我发现了一个相当不方便的方面hg log特征基本上当我输入它时我会在顶部看到最新的更改在底部看到最旧的更改但这很烦人因为大多数时候您希望看到最新的修订版所以假设我有 100
为 CKEditor 指定自定义配置文件

我正在尝试将 CKEditor 添加到我当前正在开发的页面但在让它获取我的自定义配置文件时遇到问题我在 Visual Studio NET 2008 中使用 CKEditor 我需要自定义显示的工具栏因为 Basic 太少了而 Fu
如何在 XAML 和 C# 中将字符串列表显示为 DataGrid（表）

我已经在 SO 上潜伏了很长时间直到最近才决定建立一个帐户我花了很多时间试图解决这个我一直没有询问的问题但我就在这里我正在努力实现的目标我有一个字符串列表例如 Mango Banana Melon 我们称之为水果我想将其显示为
快速 HTML 表格排序？

是的我知道有一个lot有很多 JS jQuery 程序可以做到这一点我目前正在使用http www kryogenix org code browser sorttable sorttable js http www kryogenix
将单元格背景颜色设置为其包含的 RGB 值。如何？

下面是我希望通过手动复制和粘贴以外的方式实现的屏幕截图这是材料设计调色板在 Excel 中看起来很棒如何循环遍历范围 B2 B15 并将每个单元格背景颜色设置为其相应的包含颜色也许是一个VBA loop去经历垂直 B 单元格范围解
使用plot(...,add=T) 叠加栅格图会导致最终图任意错位

我发现当我尝试使用plot add T 叠加多个栅格时如果我尝试将超过3 个栅格叠加在一起则后续图不会正确对齐栅格我的初衷是创建一个模拟土地覆盖的分类地图其中代表覆盖类别的颜色深浅随着我们模型投影的确定性而变化为此我创建了一个
如何使用curl将多个参数传递给cron作业？

我正在运行两个 cron 作业这个执行没有问题 curl sS http example com cronjob php days 1 但这根本不运行 curl sS http example com cronjob php days 1
Spring HATEOAS（w Spring Boot）返回 Resources 或 PagedResources 结果时出现 JAXB 编组错误

我的控制器中有这样的东西 RequestMapping ResponseBody public HttpEntity
PhoneGap 应用程序在 Android 上无响应

我创建了一个简单的 PhoneGap 应用程序现在只需在您点击按钮时拍摄一张照片然后在同一页面上的图像中显示该照片我已经构建了iOS和Android版本 iOS版本运行良好另一方面 Android 版本突出显示该按钮但从不切换到相
Rest 和 Http 中“无状态”的含义

当我阅读有关 REST 是什么的文档时他们总是说 REST api 应该是无状态的在这里我感觉有点尴尬因为普通的 HTTP 也是无状态的既然REST可以说是一种使用HTTP协议的特殊架构那么说REST应该是无状态的似乎是多余的
将更改从通用差异导入 git 存储库

我正在尝试将更改从一个源代码控制系统专有且复杂导入到 git 存储库中我目前正在通过运行一个脚本来执行此操作该脚本只是按顺序同步到每个修订版并将其提交到 git 存储库但由于各种原因这已变得不可行对于每个修订版我都可以获得描
从单击的按钮上移除焦点

当我单击按钮时焦点将设置到该按钮如何使用 C 中的 WIN API 移除此按钮的焦点我想也许以某种方式SendMessageWIN API 方法可以从按钮上移除焦点我只有按钮的句柄也无法再访问父窗口我知道几乎每次都可以使用 Se
如何理解SpatialDropout1D以及何时使用它？

偶尔我会看到一些模型正在使用SpatialDropout1D代替Dropout 例如在词性标记神经网络中他们使用 model Sequential model add Embedding s vocabsize EMBED SIZE i

如何理解SpatialDropout1D以及何时使用它？

如何理解SpatialDropout1D以及何时使用它？ 的相关文章

随机推荐

热门标签

如何理解SpatialDropout1D以及何时使用它？的相关文章