In AlexNet http://www.cs.toronto.edu/%7Efritz/absps/imagenet.pdf,图像数据为3*224*224
.
第一个卷积层用96个大小的核对图像进行过滤11*11*3
步幅为 4 像素。
我对第一层的输出神经元数量有疑问。
在我看来,输入是224*224*3=150528
,那么输出应该是55*55*96=290400
但在论文中,他们描述的输出是253440
如何计算这一层神经元的数量?
看起来输入大小是 227x227,没有填充。我也认为他们在论文中提到的是一个错误。看看这个链接。
http://cs231n.github.io/卷积网络/ http://cs231n.github.io/convolutional-networks/
它提到:
克里热夫斯基等人。赢得 2012 年 ImageNet 挑战的架构接受尺寸为 [227x227x3] 的图像。在第一个卷积层上,它使用感受野大小 F=11、步长 S=4 且无零填充 P=0 的神经元。由于 (227 - 11)/4 + 1 = 55,并且由于 Conv 层的深度为 K=96,因此 Conv 层输出体积的大小为 [55x55x96]。 55 个中的每一个55该体积中的 96 个神经元连接到输入体积中大小为 [11x11x3] 的区域。此外,每个深度列中的所有 96 个神经元都连接到输入的相同 [11x11x3] 区域,但当然具有不同的权重。有趣的是,如果你阅读实际的论文,它声称输入图像是 224x224,这肯定是不正确的,因为 (224 - 11)/4 + 1 显然不是整数。这让 ConvNets 历史上的许多人感到困惑,并且对发生的事情知之甚少。我自己的最佳猜测是 Alex 使用了 3 个额外像素的零填充,但他在论文中没有提到这一点。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)