如何确定 Keras Conv2D 函数中的“filter”参数

2024-05-14

我刚刚开始我的 ML 之旅，并且已经完成了一些教程。（对我而言）不清楚的一件事是如何为 Keras Conv2D 确定“过滤器”参数。

我读过的大多数资料只是将参数设置为 32，没有任何解释。这只是经验法则还是输入图像的尺寸起作用？例如，CIFAR-10中的图像为32x32

具体来说：

model = Sequential()
filters = 32
model.add(Conv2D(filters, (3, 3), padding='same', input_shape=x_train.shape[1:]))

model.add(Activation('relu'))
model.add(Conv2D(filters, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))

下一层的滤波器参数为filter*2或64。同样，这是如何计算的？

Tx.

Joe

事实上 - 你的问题没有一个好的答案。大多数架构通常都是在多次实验中精心设计和微调的。我可以与您分享一些在设计自己的架构时应该应用的经验法则：

Avoid a 维度崩溃在第一层。假设您的输入过滤器有一个(n, n)空间形状为RGB图像。在这种情况下，最好将过滤器编号设置为大于n * n * 3因为这是单个过滤器输入的维度。如果您设置较小的数字 - 您可能会因为初始化而丢失信息维度而丢失有关图像的许多有用信息。当然 - 这不是一般规则 - 例如对于图像复杂性较低的纹理识别 - 少量过滤器实际上可能会有所帮助。
更多地考虑体积而不是过滤器数量- 设置过滤器数量时，重要的是要考虑体积变化，而不是连续层之间过滤器数量的变化。例如。在VGG- 即使在池化层之后过滤器的数量加倍 - 实际的特征图体积减少了 2 倍，因为池化将特征图减少了 2 倍4。通常，将卷大小减少 3 以上应该被视为不好的做法。大多数现代架构使用 1 到 2 范围内的体积下降系数。不过，这不是一般规则。如果层次结构较窄，则成交量下降的较大值实际上可能会有所帮助。
Avoid 瓶颈。正如人们可能在这一里程碑中读到的那样paper https://arxiv.org/abs/1512.00567瓶颈可能会严重损害您的训练过程。当音量下降太严重时会发生这种情况。当然 - 这仍然可能实现 - 但是你应该使用智能下采样，例如使用在Inception v>2
检查 1x1 卷积- 人们相信过滤器的激活是高度相关的。人们可以通过使用来利用它1x1卷积 - 即滤波器大小为 1 的卷积。这使得例如音量下降而不是pooling或智能下采样（参见示例here https://arxiv.org/pdf/1612.08242.pdf）。你可以例如再构建两倍的过滤器，然后通过使用 1x1 卷积作为连续层来削减其中的 25%。

正如你所看到的。没有简单的方法来选择过滤器的数量。除了上面的提示之外，我想与您分享我最喜欢的关于过滤器数量的健全性检查之一。只需 2 个简单步骤：

尝试通过正则化对 500 个随机图像进行过度拟合。
尝试在不进行任何正则化的情况下对整个数据集进行过度拟合。

通常 - 如果过滤器的数量太少（一般情况下） - 这两个测试会告诉你这一点。如果 - 在你的训练过程中 - 通过正则化 - 你的网络严重过度拟合 - 这清楚地表明你的网络有太多的过滤器。

Cheers.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

neuralnetwork

Keras

convneuralnetwork

Convolution

如何确定 Keras Conv2D 函数中的“filter”参数的相关文章

对于神经网络来说，拥有正态分布的数据重要吗？

因此与数据相关的标准操作之一就是对其进行归一化并将其标准化为均值为 0 标准差为 1 的正态分布数据对吧但是如果数据不是正态分布怎么办另外所需的输出也必须呈正态分布吗如果我希望我的前馈网络在两个类 1 和 1 之间进行分类
使用 scikit-learn 在朴素贝叶斯分类器中混合类别数据和连续数据

我正在使用 Python 中的 scikit learn 开发分类算法来预测某些客户的性别除此之外我想使用朴素贝叶斯分类器但我的问题是我混合了分类数据例如在线注册接受电子邮件通知等和连续数据例如年龄长度会员资格等
了解最大池层之后的全连接层的尺寸[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案在下图架构中 4096 个单元的全连接密集层是如何从最后一个最大池层右侧维度导出的256x13x13 而不是 4096 不应该
深度学习——一些关于caffe的幼稚问题

我试图了解 caffe 的基础知识特别是与 python 一起使用我的理解是模型定义比如给定的神经网络架构必须包含在 prototxt file 当您使用数据训练模型时 prototxt 您将权重模型参数保存到 caffemode
如何访问 tf.layers.conv2d 中的内核变量？

我想可视化卷积层中的权重以观察它们如何变化但我找不到一种方法来访问卷积层中的权重tf layers conv2d 谢谢您可以通过名称访问该变量 weights sess run
尝试在 Keras 中创建 BLSTM 网络时出现类型错误

我对 Keras 和深度学习有点陌生我目前正在尝试复制这个paper https pdfs semanticscholar org 4afe f0c6039a5d8b647518b6fe05f47a8bd3aeee pdf但是当我编译第二
如何使用 Keras 中的 Conv2D 在 5D 张量的最后三个维度上应用卷积？

通常的输入张量Conv2DKeras 中是一个 4D 张量其维度为batch size n n channel size 现在我有一个 5D 张量其尺寸为batch size N n n channel size我想对中的每个 i 应用
如何解决错误：PyTorch 中预期输入批量大小与目标批量大小不匹配？

我尝试通过 PyTorch 在 CIFAR10 数据集上创建逻辑模型但是我收到错误 ValueError 预期输入batch size 900 与目标batch size 300 匹配我认为正在发生的事情是 3 100 是 300 所以
Tensorflow推荐的系统规格？

我开始在我的 RHEL 6 5 机器上安装 Tensorflow 但事实证明 Tensorflow 需要 glibc gt 2 17 而 rhel 6 5 上默认的 glibc 是 2 12 我想知道是否有人可以帮助我了解张量流的最低推荐
地图应用的聚类算法

我正在研究地图上的聚类点纬度经度对于快速且可扩展的合适算法有什么建议吗更具体地说我有一系列纬度经度坐标和一个地图视口我正在尝试将靠近的点聚集在一起以消除混乱我已经有了解决问题的方法 see here http bouldr
多输出回归问题的多重损失

所以我试图训练一个 CNN 模型来预测 4 个实值输出回归问题我尝试使用均方误差作为损失函数我的问题是我是否将输出层分支为 4 个不同的输出层其中有 4 个不同的输出层由于最后一层的权重是单独更新的 loss 4 MSE 确实可以使
AssertionError: d['w'] | 的值错误深度学习专业化

我正在完成深度学习专业的第一门课程其中第一个编程任务是从头开始构建逻辑回归模型由于这是我第一次从头开始构建模型而且我花了一些时间来消化高等数学所以我有很多错误其中我发现了一个我完全无法修复并且无法理解的问题这是一个断言错误说
神经网络的层和神经元

我想更多地了解神经网络我正在开发一个 C 程序来制作神经网络但我坚持使用反向传播算法很抱歉没有提供一些工作代码我知道有很多库可以用多种语言创建神经网络但我更喜欢自己制作一个关键是我不知道要实现特定目标例如模式识别或函数近似或其
使用 tf.keras.Models.Sequential 构建的架构是否比使用 Tensorflow 的功能 API 构建的架构运行得更慢、更准确？

我只是比较了 2 个我认为等效的 VGG ish 架构一个是使用构建的tf keras Models Sequential 另一个用了Tensorflow 的函数式 API 每个人都试图解决cats vs dogs 数据集经过 10
如何使用DecisionTreeClassifier平衡分类？

我有一个数据集其中类别不平衡课程是0 1 or 2 如何计算每个类别的预测误差然后重新平衡weights相应地在 scikit learn 中如果您想完全平衡将每个类别视为同等重要您可以简单地通过class weight bala
matlab中的正则逻辑回归代码

我正在尝试正则化 LR 在 matlab 中使用以下公式很简单成本函数 J theta 1 m sum y i log h x i 1 y i log 1 h x i lambda 2 m sum theta j 梯度 J theta t
如何在 python 中使用 libSVM 计算精度、召回率和 F 分数

我想计算precision recall and f score using libsvm在Python中但我不知道如何我已经发现这个网站 http www csie ntu edu tw cjlin libsvmtools eval
神经网络 - 我的网络似乎训练得很好，但在分类报告中它是完全随机的

我正在训练一个模型来对 3 种类型的车辆进行分类一切看起来都很顺利直到我尝试用我的模型预测任何事情预测结果是完全随机的我使用 3 个类别的 15000 张图像每个类别 5000 个进行训练并使用 3 个类别的 6000 个图像
交换keras中的张量轴

我想将图像批次的张量轴从 batch size row col ch 交换为批次大小通道行列在 numpy 中这可以通过以下方式完成 X batch np moveaxis X batch 3 1 我该如何在 Keras 中做到
PyTorch 中的后向函数

我对 pytorch 的后向功能有一些疑问我认为我没有得到正确的输出 import numpy as np import torch from torch autograd import Variable a Variable torch

随机推荐

使用月份、年份、星期几和周数计算月份中的某一天

如何在 PHP 中计算月份中的某一天并给出月份年份星期几和周数例如如果我有 2013 年 9 月星期几是星期五周数是 2 那么我应该得到 6 2013 年 9 月 6 日是第二周的星期五实现此目的的一种方法是使用相对格式 h
Dart 流 .asBroadcastStream 内存泄漏

在我们的 Flutter 应用程序中我们存在内存泄漏和流未关闭的情况我们追踪源代码如下 Rx combineLatest asBroadcastStream RxDart的结果 combineLatest 是单订阅流添加 asBroa
球拍博士中的位图[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如何在 drracket 中的框架 gui 上加载位图请给出必要的代码和参考文献我承认我很难在文档中找到正确的位置来指向您这是
同一服务器上的许多应用程序具有相同的 JMX Mbean 类

我有超过 5 个 Spring Web 应用程序它们都在使用另一个通用库这个公共库有它自己的 MBean 由于强制的唯一 objectName 约束我的应用程序无法部署在同一服务器上我使用 MBean 的方式是这样的 Managed
使用 cmd/schtasks 将任务设置为在系统启动时运行

我对如何使用 schtasks 命令行安排任务在系统启动时作为 SYSTEM 运行有点困惑我已经阅读了 MS 关于 schtasks exe 的文档这里有人可以帮助我吗以下命令安排 MyApp 程序从 2001 年 3 月 15 日开
Spring Oauth2 使用 Spring Boot 2.0 返回 401 Unauthorized 错误

我正在尝试使用 spring oauth2 实现 SSO 对于 spring 1 5 x 它工作得很好但是一旦我将 oauth 服务器应用程序升级到 spring boot 2 2 3 RELEASE 我什至无法进入登录表单即将 ht
根据不平凡的标准有效合并两个数据帧

正在接听这个问题 https stackoverflow com questions 18821862 data selection error 18823432 18823432昨晚我花了一个小时试图找到一个没有增长的解决方案data
消息框按钮文本

我环顾四周似乎所有内容都可以在消息框中编辑禁止按钮上的文本 WPF http en wikipedia org wiki Windows Presentation Foundation C MessageBox Show Generic
链接异常的实现是如何工作的？

我之前问过一个question https stackoverflow com questions 3543725 should exceptions be chained in c关于如何在 C 中链接异常其中一个答案为如何完成它提供了
“源兼容性”和“目标兼容性”有什么区别？

之间有什么关系区别sourceCompatibility and targetCompatibility 当它们设置为不同的值时会发生什么根据工具链和兼容性 https docs gradle org current userguide
带有右侧固定侧边栏的 Bootstrap 响应式网格

我想创建一个带有类似引导程序的模板它尊重网格的响应系统在图中导航栏和右侧包含两个按钮是粘性的始终显示在视图上我的问题是右侧因为在引导网格系统中右侧块将被视为单行而主要内容包含多行我怎样才能做到这一点围绕整个 Boot
SQL 事务如何工作？

我从事 SQL 工作的时间并不长但我想我明白通过将 SQL 语句包装在事务中所有语句都会完成或者都不会完成这是我的问题我有一个包含 lineitem 集合的订单对象行项目在 order OrderId 上相关我已经证实所有
如何将 NSDate 转换为 NSString？

我想将 NSDate 转换为 NSString 这怎么可能我尝试了这个但它不起作用它正在生成异常 NSString dateToString NSString alloc initWithFormat NSString dateObj
如何用纯JavaScript控制变换距离

我做的http codepen io adamchenwei pen dOvJNX http codepen io adamchenwei pen dOvJNX 我尝试对 dom 应用某种移动方式使其移动固定距离并停止而不是动画并移动穿
通过应用程序组在应用程序之间通信和保存数据

iOS 8 昨天发布了一个有关应用程序组的新 API 以前在应用程序之间共享数据和通信有点混乱我相信这正是应用程序组旨在纠正的问题在我的应用程序中我启用了应用程序组并添加了一个新组但我找不到任何有关如何使用它的文档文档和 API
在 R 中按组检查重叠开始和结束时间

我想检查数据的重叠这是数据 ID lt c rep 1 3 rep 3 5 rep 4 4 rep 5 5 Begin lt c 0 2 5 3 7 8 7 25 25 10 15 17 20 1 NA 10 11 13 End lt c
如何快速防止标签中出现孤儿？

我有一个可以有一两行的标签如果它有两行我希望第二行至少有两个或者可能三个单词而不仅仅是一个关于如何使用 swift 实现这一点有什么想法吗提前致谢 Daniel 编辑我删除了我愚蠢的第一个想法这些想法并没有真正的帮助好吧
如何延迟 AngularJS 应用程序初始化？

我有一些数据正在后台异步处理并且希望延迟整个 AngularJS 应用程序的初始化直到完成 BackgroundData initialized 是一个 Q 承诺所以像这样 BackgroundData initialized the
在 Rails 6 上定义 Secret_key_base 的正确方法是什么？

正确的定义方式是什么secret key base既然我们已经有了每个环境的凭据就可以在 Rails 6 上使用了吗我的环境有变量SECRET KEY BASE但 Rails 并没有接受它我尝试定义secret key base in
如何确定 Keras Conv2D 函数中的“filter”参数

我刚刚开始我的 ML 之旅并且已经完成了一些教程对我而言不清楚的一件事是如何为 Keras Conv2D 确定过滤器参数我读过的大多数资料只是将参数设置为 32 没有任何解释这只是经验法则还是输入图像的尺寸起作用例如 CIF

如何确定 Keras Conv2D 函数中的“filter”参数

如何确定 Keras Conv2D 函数中的“filter”参数 的相关文章

随机推荐

热门标签

如何确定 Keras Conv2D 函数中的“filter”参数的相关文章