Keras cifar10 示例验证和测试损失低于训练损失

2024-02-06

我正在使用 Keras 的 cifar10 示例，你可以找到它here https://github.com/fchollet/keras/blob/master/examples/cifar10_cnn.py。我已经重新创建了模型（即，不是相同的文件，但其他所有内容几乎相同），您可以找到它here https://github.com/sudarshan85/dl-projects/blob/kcifar/keras-cifar10/cifar10_cnn.py.

该模型是相同的，我在 50,000 个图像训练集上使用 0.2 验证分割训练该模型 30 个时期。我无法理解我得到的结果。我的验证和测试损失小于训练损失（相反，训练准确性低于验证和测试准确性）：

                      Loss       Accuracy
   Training          1.345          0.572
 Validation          1.184          0.596
       Test           1.19          0.596

看看这个图，我不确定为什么训练误差再次开始如此严重地增加。我是否需要减少训练的 epoch 数量或者实施提前停止？不同的模型架构会有帮助吗？如果是的话，有什么好的建议呢？

Thanks.

这种现象很少见，但时有发生。出现这种情况的原因有多种：

较小的数据集具有较小的内在方差所以这意味着您的模型正确地捕获了数据中的模式并且火车错误更大只是因为内部方差训练集大于然后验证集.
简单的事故- 这也可能发生 - 你的分裂适合这种行为。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

neuralnetwork

deeplearning

Keras

convneuralnetwork

Keras cifar10 示例验证和测试损失低于训练损失的相关文章

使用 Huggingface 变压器仅保存最佳权重

目前我正在使用 Huggingface transformers 构建一个新的基于 Transformer 的模型其中注意力层与原始模型不同我用了run glue py检查我的模型在 GLUE 基准测试上的性能但是我发现huggi
了解最大池层之后的全连接层的尺寸[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案在下图架构中 4096 个单元的全连接密集层是如何从最后一个最大池层右侧维度导出的256x13x13 而不是 4096 不应该
TensorFlow 中的 global_step 是什么意思？

在这就是教程代码 https github com tensorflow tensorflow blob master tensorflow examples tutorials mnist mnist py来自 TensorFlow 网站
Keras Predict_classes 方法返回“列表索引超出范围”错误

我对 CNN 和机器学习总体来说是新手并且一直在尝试遵循 TensorFlow 的图像分类教程现在可以找到Google Colabhere https colab research google com drive 1gwZp7 t
如何在带有 LSTM 层的 TensorFlow Hub 中使用嵌入模型？

我正在学习 TensorFlow 2 通过 TF Hub 教程进行文本分类它使用了 TF hub 的嵌入模块我想知道是否可以修改模型以包含 LSTM 层这是我尝试过的 train data validation data test d
sklearn：如何在 sknn 中重置回归器或分类器对象

我定义了一个回归器如下所示 nn1 Regressor layers Layer Rectifier units 150 Layer Rectifier units 100 Layer Linear regularize L2 dropo
如何组合多个朴素贝叶斯分类器的输出？

我是新来的我有一组使用 Sklearn 工具包中的朴素贝叶斯分类器 NBC 构建的弱分类器我的问题是如何结合每个 NBC 的输出来做出最终决定我希望我的决定是基于概率而不是标签我用 python 编写了以下程序我假设 sklean
地图应用的聚类算法

我正在研究地图上的聚类点纬度经度对于快速且可扩展的合适算法有什么建议吗更具体地说我有一系列纬度经度坐标和一个地图视口我正在尝试将靠近的点聚集在一起以消除混乱我已经有了解决问题的方法 see here http bouldr
无法更改现有 Keras 模型中的激活

我有一个普通的 VGG16 模型relu激活即 def VGG 16 weights path None model Sequential model add ZeroPadding2D 1 1 input shape 3 224 224
修改Keras中的层权重

我正在尝试修改 Keras 中某个层的输出我有一个编码器它将时间序列转换为潜在空间之后对于每个压缩的时间序列我想向时间序列添加一些数字例如我有 input d Input 100 h1 d Reshape 100 1 input
AttributeError：模块“keras.engine”没有属性“Layer”

当我试图运行时Parking Slot mask rcnn py文件我收到如下错误mrcnn model py文件我该如何解决 gt 2021 06 17 08 25 18 585897 W tensorflow stream execut
使用 flow_from_dataframe y_col 的正确“值”是什么

我正在用 pandas 读取 csv 文件并给出存储在中的列名称colname colnames file label Read data from file data pd read csv Hand Annotations 2 csv
从 Keras 检查点加载

我正在 Keras 中训练一个模型我使用以下代码保存了所有内容 filepath project model hdh5 checkpoint ModelCheckpoint project model hdf5 monitor loss
池化与随时间池化

我从概念上理解最大总和池中发生的情况作为 CNN 层操作但我看到这个术语随时间变化的最大池或随时间变化的总和池例如用于句子分类的卷积神经网络 https arxiv org pdf 1408 5882 pdfYoon Kim
使用 tf.keras.Models.Sequential 构建的架构是否比使用 Tensorflow 的功能 API 构建的架构运行得更慢、更准确？

我只是比较了 2 个我认为等效的 VGG ish 架构一个是使用构建的tf keras Models Sequential 另一个用了Tensorflow 的函数式 API 每个人都试图解决cats vs dogs 数据集经过 10
根据caffe中的“badness”缩放损失值

我想根据训练期间当前预测与正确标签的接近远近来缩放每个图像的损失值例如如果正确的标签是猫而网络认为它是狗那么惩罚损失应该小于网络认为它是汽车的情况我正在做的方式如下 1 我定义了标签之间距离的矩阵 2 将该矩
PyTorch 中的标签平滑

我正在建造一个ResNet 18分类模型为斯坦福汽车使用迁移学习的数据集我想实施标签平滑 https arxiv org pdf 1701 06548 pdf惩罚过度自信的预测并提高泛化能力 TensorFlow有一个简单的关键字参数Cr
理解高斯混合模型的概念

我试图通过阅读在线资源来理解 GMM 我已经使用 K 均值实现了聚类并且正在了解 GMM 与 K 均值的比较以下是我的理解如有错误请指出 GMM 类似于 KNN 在这两种情况下都实现了聚类但在 GMM 中每个簇都有自己独立的均值和
预处理 csv 文件以与 tflearn 一起使用

我的问题是关于在将 csv 文件输入神经网络之前对其进行预处理我想使用 python 3 中的 tflearn 为著名的 iris 数据集构建一个深度神经网络数据集 http archive ics uci edu ml machine
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp

随机推荐

C# WPF - 如何修改 ToolBar.ButtonStyleKey 样式

我需要在鼠标悬停时显示工具栏按钮边框否则隐藏它我尝试执行以下操作
本土化。扩展 ASP.NET Resx 资源提供程序

对于我的网站我有一个用于本地化目的的自定义资源提供程序本地化字符串存储在数据库中它工作得很好但我希望它能够与默认的 Resx 资源提供程序一起使用在 resx 资源中查找本地化字符串如果不存在则从数据库中提取它但看起来一旦我
Grpc Client 抛出 Grpc.Core.RpcException （响应协议降级为 HTTP/1.1。）

我度过了最后三天阅读焦点尝试不同版本的 VS 和 NET 检查 Stackoverflow 中的问题 github 中的问题关于我的 Grpc 客户端服务器启动正常但客户端无法工作我尝试过Grpcurl 工作正常 but C 客户
Javascript 检测关闭加载了另一个域的弹出窗口

我正在打开一个弹出窗口并将 onbeforeunload 事件附加到它如下所示 win window open http www google com width 300px height 300px win onbeforeunload
在书写模式下设置垂直中间

我有一个带有一些文本的 div 和writing mode vertical rl 现在我希望这段文字位于中间但是vertical align middle 即使设置也不起作用line height a background color
使用 Outlook REST API 时为什么日历 ID 会发生变化？

我们构建了一个使用 Outlook REST API V1 和 V2 版本的应用程序我们偶尔会看到用户日历更改的日历 ID 具体来说我们使用 GET 获取日历https outlook office com api v2 0 me ca
指针、数组、printf

我正在尝试使用一个数组来保存调查的输入该调查的每一侧都具有相同的正值但有一个指针指向数组的中心因此可以使用负指针值来访问该数组例如数组将保存从 0 到 30 的值指针将指向 15 系统将提示用户输入 15 到 15 之间的值其
MacOSX 10.9.5 上的 Sed 错误“\1 未在 RE 中定义”

我正在尝试使用 bash 为我的 MP3 文件名非常重要构建一个通用格式化程序其中很大一部分是能够使用正则表达式变量移动文本例如我试图删除 ft Kevin Parker 周围的括号 oldfilename Mark Ronson
Sidekiq：是否可以“暂停”队列？

是否可以暂停 sidekiq 队列我正在运行下载作业但我必须让我的 Mac 运行休眠所以我想告诉 sidekiq 暂停一下有没有一种简单的方法可以做到这一点您无法中途停止作业如果您想停止处理队列中的新作业这是 Sideki
Android中的可分包和继承

我得到了一个适用于不涉及继承的单个类的 Parcelable 实现在继承方面我无法找出实现接口的最佳方法假设我得到了这个 public abstract class A private int a protected A int a
如何使用java获取BIOS信息？

请告诉我是否可以使用 java 程序获取 BIOS 设置信息我使用 Windows 7 作为操作系统这取决于您要阅读的信息 Java 无法读取 BIOS 但 java 可以查询 WMI google for jWMI 这可能会获取您需要
在 Excel 中拆分和分组值

Hi I have a column of values which has different suffix after a dot i need it to group it based on the value after dot E
类型错误：无法重新定义属性：tap

每当我尝试运行时我都会收到此错误npm run dev webpack cli TypeError Cannot redefine property tap at Function defineProperty
数组声明中的 PHP 扩展语法

PHP 支持扩展语法可变参数函数 http php net manual en functions arguments php functions variable arg list 在 JavaScript 中您可以使用扩展语法来执行以
丑数 - dp 的数学直觉

我正在尝试找到丑陋的数字这是一系列唯一质因数为 2 3 5 的数字我找到了动态规划解决方案并想了解它是如何工作的以及逻辑背后的数学直觉是什么该算法是为 2 3 和 5 的倍数保留三个不同的计数器变量让我们假设 i2 i3 和
将峰度应用于 python 中的分布

我有一个数据集其格式为频率方向归一化功率谱密度扩展偏度峰度我可以使用顶部答案中的代码可视化特定记录的分布scipy 中的偏斜正态分布 https stackoverflow com a 5885349 1135883但我不确
YAML：具有空值的字典

如何在 YAML 中编写一个字典映射其中一个键将空字符串作为其值 key 被解析为 null YAML 1 1 map str key null null 正确答案是 key
警告：尝试多次加载角度...因为 jQuery...为什么？

我试图了解这里发生了什么事该警告是不言自明的我意识到在应用程序中使用下面的代码和结构它运行 ng view 两次测试将在控制台中记录两次所以角度当然会加载两次但为什么我已经阅读了我能找到的所有关于它的文章它似乎归结为 j
GetExternalLoginInfoAsync null 与ExternalLoginCallback 中的OWIN 除非已经登录到google

我一直在尝试使用 Google 帐户在 MVC5 应用程序中使用 OWIN 实现外部登录如果我已经登录谷歌点击我的应用程序中的谷歌按钮就可以了在允许我访问登录信息后它会将我带到我的注册页面如果我在单击我的应用程序 google 按
Keras cifar10 示例验证和测试损失低于训练损失

我正在使用 Keras 的 cifar10 示例你可以找到它here https github com fchollet keras blob master examples cifar10 cnn py 我已经重新创建了模型即不是相

Keras cifar10 示例验证和测试损失低于训练损失

Keras cifar10 示例验证和测试损失低于训练损失 的相关文章

随机推荐

热门标签

Keras cifar10 示例验证和测试损失低于训练损失的相关文章