我知道mnist数据集中的手写数字图像是28×28,但是为什么LeNet5中的输入是32×32?
您的问题已在原纸 http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf:
卷积步骤始终采用比前一层的特征图更小的输入(这对于第一层 - 输入 - 也适用):
C1 层是一个具有 6 个特征图的卷积层。
每个特征图中的每个单元都连接到输入中的 5x5 邻域。特征图的大小为28x28
防止输入连接脱落
边界。
这意味着在 32x32 输入上使用 5x5 邻域,您将获得 6 个大小为 28x28 的特征图,因为有些像素您不会在图像边界处使用(这些数字始终会有余数)。
当然,第一层可以有例外。他们仍然使用 32x32 图像的原因是:
输入是 32x32 像素图像。这明显更大
比数据库中最大的字符(最多 20x20
像素以 28x28 区域为中心)。原因是它是
期望潜在的显着特征,例如中风
端点或角点可以出现在最高级别特征检测器的感受野的中心。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)