增加或减少添加神经元或权重的学习率？

2024-04-08

我有一个卷积神经网络，我修改了它的架构。我没有时间重新训练和执行交叉验证（对最佳参数进行网格搜索）。我想要直观地调整学习率。

我是不是该increase or decrease我的 RMS（基于 SGD）优化器的学习率，如果：

I add more神经元到全连接层？
在卷积神经网络上，我在全连接之前删除了子采样（平均或最大池化）层，并增加了该特征图和 softmax 输出之间的全连接单元的数量（以便有more连接到顶部完全连接的神经元的权重）？

添加更多层/神经元会增加过度拟合的可能性。因此，随着时间的推移降低学习率会更好。删除子采样层也会增加参数数量，并再次增加过度拟合的机会。强烈建议，至少通过经验结果证明，子采样层可以帮助模型显着更好地学习。所以避免删除它们。

另外，我建议您通过裁剪图像来生成更多示例，并使用这些裁剪版本来训练模型。这作为正则化器可以帮助模型学习更好的数据分布。然后，您还可以增加层/神经元的数量，从而降低过度拟合的风险。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

neuralnetwork

deeplearning

convneuralnetwork

增加或减少添加神经元或权重的学习率？的相关文章

在逻辑回归中使用排名数据

当我努力学习这些概念时我将对此给予最大赏金我正在尝试在逻辑回归中使用一些排名数据我想使用机器学习来制作一个简单的分类器来判断网页是否好这只是一个学习练习所以我不期望有很好的结果只是希望学习过程和编码技术我已将数据放入 c
使用 Huggingface 变压器仅保存最佳权重

目前我正在使用 Huggingface transformers 构建一个新的基于 Transformer 的模型其中注意力层与原始模型不同我用了run glue py检查我的模型在 GLUE 基准测试上的性能但是我发现huggi
如何访问 tf.layers.conv2d 中的内核变量？

我想可视化卷积层中的权重以观察它们如何变化但我找不到一种方法来访问卷积层中的权重tf layers conv2d 谢谢您可以通过名称访问该变量 weights sess run
sklearn：如何在 sknn 中重置回归器或分类器对象

我定义了一个回归器如下所示 nn1 Regressor layers Layer Rectifier units 150 Layer Rectifier units 100 Layer Linear regularize L2 dropo
从 [tensorflow 1.00] 中的 softmax 层提取概率

使用张量流我有一个 LSTM 分类模型以 softmax 作为最终节点这是我的 softmax 层 with tf name scope Softmax as scope with tf variable scope Softmax
OpenCV 机器学习算法的 CSV 格式

OpenCV 中的机器学习算法似乎使用以 CSV 格式读取的数据参见示例这个 cpp文件 https code ros org trac opencv browser trunk opencv samples c tree engine
使用 Keras 时，验证集中未见的类别会出现错误

我有由数值变量和分类变量组成的数据分类变量有很多类别因此我使用嵌入来表示这些类别我的模型是一个简单的神经网络我知道当你定义嵌入层时你需要通过input dim number of categories 1为了解释训练中看不见的类别
池化与随时间池化

我从概念上理解最大总和池中发生的情况作为 CNN 层操作但我看到这个术语随时间变化的最大池或随时间变化的总和池例如用于句子分类的卷积神经网络 https arxiv org pdf 1408 5882 pdfYoon Kim
使 pycaffe 致命错误：找不到“Python.h”文件

我在运行 OSX 10 9 5 的 Mac 上编译了 caffe 并且我知道尝试编译 pycaffe 当我在 caffe 根文件夹中运行 make pycaffe 时我得到 CXX LD o python caffe caffe so p
根据caffe中的“badness”缩放损失值

我想根据训练期间当前预测与正确标签的接近远近来缩放每个图像的损失值例如如果正确的标签是猫而网络认为它是狗那么惩罚损失应该小于网络认为它是汽车的情况我正在做的方式如下 1 我定义了标签之间距离的矩阵 2 将该矩
PyTorch 中的标签平滑

我正在建造一个ResNet 18分类模型为斯坦福汽车使用迁移学习的数据集我想实施标签平滑 https arxiv org pdf 1701 06548 pdf惩罚过度自信的预测并提高泛化能力 TensorFlow有一个简单的关键字参数Cr
使用 to_categorical 转换 np.array 时出现内存问题

我有一个像这样的 numpy 数组 0 1 1 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 1 我这样改造它以减少内存需求 x val x val asty
batch_size = x.shape[0] AttributeError: 'tuple' 对象没有属性 'shape'

该代码结合图像和掩模进行图像检测我怎样才能纠正这个错误 batch size x shape 0 AttributeError tuple 对象没有属性 shape 这是用于训练的代码 train datagen ImageDataGen
朴素贝叶斯分类器仅基于先验概率做出决策

我试图根据推文的情绪将推文分为三类买入持有卖出我正在使用 R 和包 e1071 我有两个数据框一个训练集和一组需要预测情绪的新推文训练集数据框 text sentiment this stock is a good buy Bu
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为
如何区分结构化数据和非结构化数据？

结构化数据和非结构化数据有什么区别这种差异如何影响各自的数据挖掘方法我熟悉的术语是结构化的 and 非结构化的数据除了后缀之外与 Q 中的内容相同我在机器学习中使用这两种类型的数据但我不知道任何正式的定义然而我怀疑几乎每个工
对象检测 ARKit 与 CoreML

我正在建设ARKitiPhone 的应用程序我需要检测特定的香水瓶并根据检测到的内容显示内容我使用来自developer apple com的演示应用程序来扫描现实世界的对象并导出 arobject我可以在资产中使用的文件它工作正常
ValueError：形状（无，1）和（无，2）不兼容

我正在训练面部表情愤怒与快乐模型最后一个密集输出层以前为 1 但当我预测图像时它的输出始终为 1 准确度为 64 所以我将其更改为 2 表示 2 个输出但现在我收到这个错误 Epoch 1 15 ValueError Traceb
带有 LSTM 的 GridSearchCV/RandomizedSearchCV

我一直在尝试通过 RandomizedSearchCV 调整 LSTM 的超参数我的代码如下 X train X train reshape X train shape 0 1 X train shape 1 X test X test

随机推荐

Android SmsRetrieverClient 的短信验证不解析消息

尝试按照此处的步骤实现短信自动读取以进行验证 https developers google com identity sms retriever request https developers google com identity s
如何在 Spring Data REST 项目中使用 DTO？

Spring Data REST 自动仅公开域对象但大多数情况下我们必须处理数据传输对象那么如何以SDR方式做到这一点呢一种如何合作的方法DTO https en wikipedia org wiki Data transfer ob
如何在 Visual Studio Code 中获取 Unity 函数名称的智能感知？

我正在关注有关 Unity 的教程我发现讲师在编写方法名称时具有智能感知功能然而我只有类和变量的智能感知我的意思是像 Rigidbody 这样的 Unity 类和我自己的变量我还读过自动补全在 Visual Studio 中不起
Android apk 构建的条件资源包含/排除

我不断回到这个问题因为似乎没有一个干净的解决方案有没有人有一个好的策略来从 Android 子项目中排除资源我有两种情况 1 基础库项目具有 en es 等本地化文件子项目1使用所有本地化一切都很好子项目 2 仅本地化为英语但
Bookdown：如何更改章节标题的大小？

我正在使用 bookdown 为研讨会生成幻灯片我使用菜单中的大字母选项来显示幻灯片但是章节标题字体太大我在哪里如何修改那个 Thanks Paul 你可以用 css 来控制它yihui https stackoverflow
Keycloak Java 管理客户端在触发验证电子邮件时返回 400 错误

我在 Spring Boot 2 2 上使用 keycloak 服务器版本 8 0 1 和 keycloak java admin 客户端版本 8 0 1 使用 webflux 和 netty 而不是 tomcat 如果此类信息有帮助的话
Python - “ascii”编解码器无法解码字节

我正在使用 Python 2 6 和 Jinja2 创建 HTML 报告我为模板提供了许多结果模板循环遍历它们并创建 HTML 表当调用 template render 时我突然开始收到此错误 td result result st
sorl-缩略图不起作用

我已经尝试了几个小时来让 sorl thumbnail 工作但它就是行不通困难的部分是它没有显示错误所以我不知道出了什么问题我按照说明安装了它我的完整代码可以在这里找到 https github com samos123 Samo
在同一个表上触发 INSERT 和 UPDATE

众所周知实体框架无法保存地理数据所以我的想法是在我的模型中将经度和纬度指定为十进制执行用于创建表的 SQL 脚本后我将启动另一个脚本来添加地理列然后我想通过触发器在每次插入或更新经度和纬度时更新此列下面的触发器是好的还是坏
在新机器上部署.net应用程序并得到“系统无法执行指定的程序”

我有一个启动 Excel 的 net 控制台应用程序我让它在我的开发环境中运行但我无法让它在我的生产环境中运行当我尝试运行它时收到以下错误系统无法执行指定的程序我已经在我的生产服务器上安装了 net 2 0 sp2 有任何想法吗
PyQT 列表视图不响应数据更改信号

我一直在关注一些教程并尝试设置列表模型我的主窗口有两个访问同一模型的列表视图当我更新一个列表中的一项时另一个列表不会自行更新直到它获得焦点我单击它所以看起来 dataChanged 信号没有被发出但我无法弄清楚我的代码与我所基
旋转时使用拖动手柄调整 div 大小

我可以找到类似的问题涉及 jQuery UI lib 或者只有 css 没有可拖动的句柄但没有任何纯数学问题我尝试执行的是拥有一个可调整大小和可旋转的 div 到目前为止很容易我可以做到但旋转时会变得更加复杂调整大小以相反的方式
JavaScript 函数是否可以将其自己的函数调用作为字符串返回？

在 JavaScript 中函数是否可以将其自己的函数调用作为字符串返回 function getOwnFunctionCall return the function call as a string based on the para
胡萝卜2 - 我可以从文件夹中聚集文档吗？

我正在尝试对我在研究项目中收集的文档进行聚类我正在尝试使用 Carrot2 工作台但无法找到如何将胡萝卜指向包含文档的文件夹请问我该怎么做我有少量文档 txt 需要比较它们位于独立的研究机器上因此我无法连接到网络并在那里处理它们
Symfony 存储 foreach 循环的结果

我想知道是否可以存储 foreach 循环的结果我不知道如何更详细地解释我的问题所以可以说以下让我得到 3 个不同的数组 events this gt getDoctrine gt getRepository TestBundle Ev
IS 回收时正在运行的任务会发生什么情况

为了帮助提高客户端的性能我将请求的处理转移到任务上这样做是因为处理通常需要一些时间而且我不希望客户端等待一段时间才得到 200 响应将工作转移到任务上的 Web 服务始终在处理帖子 public void ProcessReques
即使在使用显式版本的 Pipfile 和 Pipfile.lock 后，用户之间也存在差异

抱歉篇幅较长这是一个非常复杂的 Pipenv 情况在我的公司我们正在使用 pipelinev 同时使用Pipfile and Pipfile lock 来控制不同工程师笔记本电脑上使用的包这对我们来说比大多数团队更重要因为我们还
Django 错误：vertualenv 环境错误：找不到 mysql_config [重复]

这个问题在这里已经有答案了当我尝试在运行 10 8 的 MAC 上的 virtualenv 中安装 MySQL python 时出现以下错误 vertualenv EnvironmentError mysql config not fo
如何在 Go 中实现不同类型的容器？ [复制]

这个问题在这里已经有答案了下面的代码在Go中实现了一个int列表 package main import fmt type List struct Head int Tail List func tail list List List r
增加或减少添加神经元或权重的学习率？

我有一个卷积神经网络我修改了它的架构我没有时间重新训练和执行交叉验证对最佳参数进行网格搜索我想要直观地调整学习率我是不是该increase or decrease我的 RMS 基于 SGD 优化器的学习率如果 I add mor

增加或减少添加神经元或权重的学习率？

增加或减少添加神经元或权重的学习率？ 的相关文章

随机推荐

热门标签

增加或减少添加神经元或权重的学习率？的相关文章