卷积神经网络如何处理通道

2024-01-27

我已经浏览了很多关于 CNN 通常处理多个通道(例如 RGB 图像中的 3 个)的方式的解释,但我仍然不知所措。

当将 5x5x3 滤镜(例如)应用于 RGB 图像的补丁时会发生什么exactly发生?实际上是每个通道分别发生 3 个不同的 2D 卷积(具有独立的权重)吗?然后将结果简单地加在一起以产生最终输出并传递到下一层?或者说它是真正的 3D 卷积?


该图片来自 Andrew Ng 的 deeplearning.ai 课程。 6 X 6 X 3 - 其中 3 对应 3 个颜色通道。 6 X 6 是图像的高度和宽度。 对于卷积步骤,我们将输入图像与 3 X 3 X 3 滤波器/内核进行卷积。输入图像和过滤器都有 3 层。 (大多数情况下,输入图像和过滤器都是相同的)。输出将为 4 X 4 X 1。 3 X 3 X 3 为您提供 27 个特征/参数,您可以将它们与相应的红色、绿色和蓝色通道相乘。最后将所有这些数字相加即可得到 4 X 4 输出图像中 [0,0] 的值。现在移动输入图像的黄色立方体并将其滑过右侧的 1 个框,一旦到达右端,您将立方体向下滑动一行并继续乘法以填充 4 X 4 输出。建议您拿一张纸和铅笔,在所有输入的立方体以及内核中填充随机值并求解乘法。

有关更多详细信息,请观看 YouTube 上的这些讲座。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

卷积神经网络如何处理通道 的相关文章

  • 神经网络误差随每个训练示例而振荡

    我已经实现了一个反向传播神经网络并根据我的数据对其进行了训练 数据在英语和非洲语句子之间交替 神经网络应该识别输入的语言 网络结构为27 16 2 输入层对于字母表中的每个字母都有 26 个输入加上一个偏置单元 我的问题是 当遇到每个新的训
  • 在 R 中绘制决策树(插入符)

    我已经训练了一个数据集rf方法 例如 ctrl lt trainControl method LGOCV repeats 3 savePred TRUE verboseIter TRUE preProcOptions list thresh
  • 如何使用 Python 3 在 OpenCV 3 上正确加载 cv2.KeyPoint 和描述符?

    有一天 我不得不恢复一个使用 OpenCV 3 和 Python 2 7 的旧项目 在此代码中 要加载 cv2 KeyPoint 我执行以下操作 import numpy as np import cPickle import cv2 ke
  • Encog:BasicNetwork:无需预先构建数据集的在线学习

    我正在尝试使用 encog 库作为强化学习问题的函数逼近器 更准确地说 我正在尝试启动并运行多层感知器 BasicNetwork 由于我的代理将根据我选择的任何 RL 算法以某种方式探索世界 因此我无法预先构建任何 BasicNeuralD
  • 尝试校准keras模型

    我正在尝试通过 Sklearn 实现来校准我的 CNN 模型CalibratedClassifierCV 尝试将其包装为KerasClassifier并覆盖预测功能但没有成功 有人可以说我做错了什么吗 这是模型代码 def create m
  • 使用 Azure 机器学习检测图像中的符号

    4年前我发帖这个问题 https stackoverflow com q 6999920 411094不幸的是 得到的一些答案超出了我的技能水平 我刚刚参加了一次构建巡演会议 他们在会上谈论了机器学习 这让我想到了使用 ML 来解决我的问题
  • 我的训练和验证代码(张量流)是否正确以及模型是否过度拟合?

    这是我的代码 for it in range EPOCH 24410 BATCH SIZE tr pa tr sp sess run tr para tr spec train loss sess run loss fw op feed d
  • 在逻辑回归中使用排名数据

    当我努力学习这些概念时 我将对此给予最大赏金 我正在尝试在逻辑回归中使用一些排名数据 我想使用机器学习来制作一个简单的分类器来判断网页是否 好 这只是一个学习练习 所以我不期望有很好的结果 只是希望学习 过程 和编码技术 我已将数据放入 c
  • 如何将 sklearn.naive_bayes 与(多个)分类特征一起使用? [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 我想学习朴素贝叶斯模型来解决类为布尔值的问题 有些特征是布尔型的 但其他特征是分类型的 并且可以采用少量值 5 如果我所有的功能都是布尔值
  • MATLAB 教程中的 SIFT 实现

    我正在寻找 MATLAB 中的一些基本 SIFT 实现 我需要从第一原则来写它 另外 我正在寻找一些可以解释程序中发生的事情的内容 Vedali 的代码和 David Lowe 的代码超出了我的理解范围 如果您是 Matlab 用户 您一定
  • 在Python中表示语料库句子的一种热门编码

    我是 Python 和 Scikit learn 库的初学者 我目前需要从事一个 NLP 项目 该项目首先需要通过 One Hot Encoding 来表示一个大型语料库 我已经阅读了 Scikit learn 关于 preprocessi
  • 多输出回归问题的多重损失

    所以我试图训练一个 CNN 模型来预测 4 个实值输出 回归问题 我尝试使用均方误差作为损失函数 我的问题是我是否将输出层分支为 4 个不同的输出层 其中有 4 个不同的输出层由于最后一层的权重是单独更新的 loss 4 MSE 确实可以使
  • 为什么 scikit learn 的平均精度分数返回 nan?

    我的 Keras 模型旨在接收两个输入时间序列 将它们连接起来 通过 LSTM 提供它们 并在下一个时间步骤中进行多标签预测 有 50 个训练样本 每个样本有 24 个时间步 每个样本有 5625 个标签 有 12 个验证样本 每个样本有
  • matlab中的正则逻辑回归代码

    我正在尝试正则化 LR 在 matlab 中使用以下公式很简单 成本函数 J theta 1 m sum y i log h x i 1 y i log 1 h x i lambda 2 m sum theta j 梯度 J theta t
  • 使用 ImageMagick 有效地将线扫描图像拼接在一起

    我正在寻找线扫描相机的替代品 用于体育计时 或者更确切地说 用于需要确定位置的部分 我发现普通工业相机可以轻松与商业相机解决方案的速度相匹配 每秒 gt 1000 帧 对于我的需求来说 通常计时的准确性并不重要 重要的是运动员的相对位置 我
  • sklearn ShuffleSplit 出现“__init__() 获得参数 'n_splits' 的多个值”错误

    我正进入 状态 init 获得参数 n splits 的多个值 该行的错误 cv ShuffleSplit n splits 10 test size 0 2 random state 0 在下面的代码中 import matplotlib
  • 机器学习鸡尾酒会音频应用

    我对这篇文章有一个疑问 鸡尾酒会算法 SVD 实现 用一行代码 https stackoverflow com questions 20414667 cocktail party algorithm svd implementation i
  • 有没有keras方法来分割数据?

    我认为标题是不言自明的 但要详细询问 有 sklearn 的方法train test split 其工作原理如下 X train X test Y train Y test train test split X Y test size 0
  • opencv - 在图像中绘制轮廓

    我正在尝试在图像周围绘制轮廓 我可以看到找到了轮廓 但无法绘制轮廓 轮廓的颜色似乎是两种 黑色和白色 颜色中的一种 import cv2 import numpy as np import matplotlib pyplot as plt
  • 带有 LSTM 的 GridSearchCV/RandomizedSearchCV

    我一直在尝试通过 RandomizedSearchCV 调整 LSTM 的超参数 我的代码如下 X train X train reshape X train shape 0 1 X train shape 1 X test X test

随机推荐

  • 命令行curl超时参数

    我正在使用命令行curl程序 有趣的是我找不到命令行curl的超时参数 我阅读了 curl 的手册页并用谷歌搜索 但仍然找不到 这libcurl有超时参数 CURLOPT TIMEOUT 但这不是我想要的 我正在寻找命令行curl超时参数
  • document.ready() 内部函数和 标签中的函数之间的区别

    这两个函数有什么区别 1 document ready function myfunc function dosomething do something 2 The document ready 函数在 DOM 加载完成时执行 看http
  • mvc3 - 如何从源代码禁用符号的 htmlencode

    我需要从数据库表中取出页面文本 表字段 文本 包含带有 html 格式标记的文本 例如 p br 等等 在表中它没有编码 当我尝试使用 Model Text 输出时 我看到编码的 html 标签 例如 lt p gt 我怎样才能禁用这个 h
  • 如何发现正在使用的 Linux 发行版

    有时我需要访问一些运行Linux 或者可能是另一个类Unix SO 的服务器 但我不知道如何验证哪些服务器分配 http en wikipedia org wiki Linux distribution正在服务器上使用 有时甚至服务器的 负
  • 当我尝试在 Xcode 中重构时,出现一条警告,要求将文件添加到此工作区中目标的构建阶段

    当我尝试通过重命名来重构代码时 我经常看到此消息 h is not part of the build phase of any targets in this workspace and so can t be refactored Ad
  • 创建没有数组的刽子手游戏[关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 这就是输出的样子 我需要在原始字符串中找到猜测的索引 如果这是真的 那么应该用读入的字符替换索引处的问号 字符串猜测 之后 它应该从字符串
  • 表达式求值的顺序

    我很好奇一些不同类型的表达式的顺序 所以我在顶部声明级别尝试了这段代码 认为它会失败 但发现它有效 http play golang org p CfP3DEC5LP http play golang org p CfP3DEC5LP va
  • 在新的 CardView 中对齐多个 TextView

    我正在尝试创建一个 CardView 它将显示作者的引用 包括作者姓名 引用以及其下面的引用 我想我已经掌握了大部分内容 但似乎对齐 TextView 的一般规则似乎不适用于 CardView 我在这里研究发现你应该添加android la
  • ANT - 无法加载依赖类 com/jcraft/jsch/Logger

    我的 Ant 脚本有问题 我需要将文件复制到 Linux 服务器
  • go 中 ioutil.ReadAll 的替代方案?

    对于我正在制作的程序 此函数作为 for 循环中的 goroutine 运行 具体取决于传入的 url 数量 没有设定数量 func makeRequest url string ch chan lt string errors map s
  • 当两个超类具有同名但签名不同的成员函数时,存在歧义

    struct A void f int x struct B template
  • 安装了Visual Studio 2010 SP1,仍然不支持CSS3和HTML5

    我已从以下位置下载了最新版本的 Visual Studio 2010 Service Pack 1 here http www microsoft com download en details aspx id 23691 然而 在我提取文
  • 如何在分解时间序列图中自定义标题、轴标签等

    我相当熟悉通过编写自己的 x 轴标签或主标题来修改绘图的常用方法 但在绘制时间序列分解的结果时 我无法自定义输出 例如 library TTR t lt ts co2 frequency 12 start 1 deltat 1 12 td
  • 测试小程序的最佳机制是什么?

    我正在尝试有效地为小程序构建一个功能测试套件 并且我正在尝试为其找到一个好的框架 过去 当我想设计一个测试套件来对应用程序进行功能测试和负载测试时 它始终是基于 Web 的应用程序 或者至少是某种基于服务的应用程序 并且我已经使用grind
  • 如何在http get请求中设置标头?

    我正在 Go 中执行一个简单的 http GET client http Client req http NewRequest GET url nil res client Do req 但我找不到自定义请求标头的方法doc http go
  • 如何获取维基数据上所有电影的列表?

    我正在使用 Freebase 为我的网站获取所有电影 但它很快就会被关闭 所以我在寻找另一个免费的电影数据库并发现了维基数据 说实话 如何查询所有电影太复杂了 所以我想你们可以帮助我获取维基数据中的所有电影 将来我还想加入电视节目和连续剧
  • jQuery - 对数组进行排序?

    我使用 Ajax 获取一些 XML 然后用结果填充表单上的一些字段 表单上有一个数字字段 我想按该数字对结果进行排序 从高到低的在前 我将如何在 jQuery 中做到这一点 我的js函数代码目前是 function linkCounts w
  • 运行时动态绑定和类继承之间的区别

    我试图澄清动态语言 Python Ruby 和静态类型语言 java C 中运行时动态绑定和类继承的概念 我不确定我是对还是错 在 Python 和 Ruby 等动态语言中 运行时动态绑定是作为鸭子类型实现的 当解释器检查对象的类型时 它检
  • 新 Chrome 打包应用程序的最小/最大按钮在哪里?

    我正在使用 Chrome 的开发通道 v23 并且正在使用新的Chrome 打包应用程序 http developer chrome com dev apps about apps html平台 新平台的目的之一是将打包应用程序 从浏览器中
  • 卷积神经网络如何处理通道

    我已经浏览了很多关于 CNN 通常处理多个通道 例如 RGB 图像中的 3 个 的方式的解释 但我仍然不知所措 当将 5x5x3 滤镜 例如 应用于 RGB 图像的补丁时会发生什么exactly发生 实际上是每个通道分别发生 3 个不同的