Ablation Study消融研究

2023-11-12

作者:飘哥
链接:https://www.zhihu.com/question/291655038/answer/683038545
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
 

” 术语“消融研究”通常用于神经网络,尤其是相对复杂的神经网络,如R-CNN。我们的想法是通过删除部分网络并研究网络的性能来了解网络。“ - Robert Long

“消融”的原始含义是手术切除身体组织。

ablation
解释: 通过机械方法切除身体组织,如手术,从身体中去除,尤指器官、异常生长或有害物质。

“消融研究”这一术语的根源于20世纪60年代和70年代的实验心理学领域,其中动物的大脑部分被移除以研究其对其行为的影响。
在机器学习,特别是复杂的深度神经网络的背景下,已经采用“消融研究”来描述去除网络的某些部分的过程,以便更好地理解网络的行为。

自从Keras深度学习框架的主要作者Francois Chollet在2018年6月发布twtter以来,该术语受到了关注:

消融研究对于深度学习研究至关重要。理解系统中的因果关系是产生可靠知识的最直接方式(任何研究的目标)。消融是一种非常省力的方式来研究因果关系。
如果您采用任何复杂的深度学习实验设置,您可能会删除一些模块(或用随机的模块替换一些训练有素的功能)而不会降低性能。消除研究过程中的噪音:进行消融研究。
无法完全理解您的系统?很多活动部件?想确定它的工作原因是否与您的假设密切相关?尝试删除东西。花费至少约10%的实验时间来诚实地反驳你的论文。

举个例子:Girshick及其同事描述了一个由三个“模块”组成的物体检测系统:第一个使用选择性搜索算法提出图像区域,在该区域内搜索物体。进入一个大的卷积神经网络(有5个卷积层和2个完全连接的层),进行特征提取,然后进入一组支持向量机进行分类。为了更好地理解该系统,作者进行了一项消融研究,其中系统的不同部分被移除 - 例如,移除CNN的一个或两个完全连接的层导致性能损失惊人地少。

这使作者得出结论:

CNN的大部分代表性力量来自其卷积层,而不是来自更大的密集连接层。

例子参考:

Girshick, R., Donahue, J., Darrell, T. and Malik, J., 2014. 《Rich feature hierarchies for accurate object detection and semantic segmentation》. In Proceedings of the IEEE conference on computer vision and pattern recognition (580-587页).

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Ablation Study消融研究 的相关文章

  • 深度学习笔记(二)

    计算机视觉 xff1a 人类肉眼识别的错误率大概在5 到2016年的时候 xff0c 计算机视觉中 xff0c 用深度学习网络达到的错误率已经远低于人类 卷积神经网络 xff08 CNN xff09 1 应用领域 神经网络和卷积神经网络都是
  • 深度学习笔记1:end-to-end、anchor box解释、人体检测代码

    SSD xff08 SSD Single Shot MultiBox Detector xff09 是采用单个深度神经网络模型实现目标检测和识别的方法 该方法是综合了Faster R CNN的anchor box和YOLO单个神经网络检测思
  • 动手学深度学习——数据操作之ndarray与tensor间的转换

    为什么可以转换 无论使用哪个深度学习框架 它的张量类 在MXNet中为ndarray 在PyTorch和TensorFlow中为tensor 都与Numpy的ndarray类似 但深度学习框架又比Numpy的ndarray多一些重要功能 首
  • 激活函数之softmax函数

    1 softmax函数 分类问题中使用的 softmax 函数可以用下面的式表示 exp x 是表示 ex 的指数函数 e 是纳皮尔常数 2 7182 式 3 10 表示假设输出层共有 n 个神经元 计算第 k 个神经元的输出 yk 如式
  • 【深度学习】最全的十九种损失函数汇总

    tensorflow和pytorch很多都是相似的 这里以pytorch为例 文章目录 一 L1范数损失 L1Loss 二 均方误差损失 MSELoss 三 交叉熵损失 CrossEntropyLoss 四 KL 散度损失 KLDivLos
  • 【机器学习】干货:计算两个向量之间相似性的方法(含源代码)

    最近在做实验的时候 需要计算两个向量之鉴的相似性 该如何实现呢 文章目录 一 余弦相似性 Cosine Similarity 1 1 理论 1 2 实践 1 2 1 文本处理 1 2 2 图像处理 1 2 3 推荐系统 1 2 4 聚类分析
  • 深度学习笔记(八):目标检测性能评价指标(mAP、IOU..)

    一 mAP 这里首先介绍几个常见的模型评价术语 现在假设我们的分类目标只有两类 计为正例 positive 和负例 negtive 分别是 1 True positives TP 被正确地划分为正例的个数 即实际为正例且被分类器划分为正例的
  • 深度学习(二)(loss、BP、正则化、激活函数)

    神经网络基础 目录 神经网络基础 5 得分函数 6 损失函数 7 前向传播整体流程 8 反向传播计算方法 9 神经网络整体架构 10 神经网络架构细节 11 神经元的个数对结果的影响 12 正则化与激活函数 13 神经网络过拟合解决办法 5
  • 动手学深度学习——矩阵求导之自动求导

    深度学习框架通过自动计算导数 即自动微分 automatic differentiation 来加快求导 实际中 根据我们设计的模型 系统会构建一个计算图 computational graph 来跟踪计算是哪些数据通过哪些操作组合起来产生
  • 【计算机视觉

    文章目录 一 前言 二 可以获得什么 三 入门实践 3 1 帮助文档 3 2 安装 3 3 模型的组成 3 4 BERT模型的使用 3 4 1 导入模型 3 4 2 使用模型 3 4 2 1 tokenizer 3 5 model 3 6
  • 【深度学习

    文章目录 一 问题引入 二 如何读取路径呢 一 问题引入 当使用 torchvision datasets Celeba 加载 CELEBA 数据集时 我们如何获取文件的路径是一个问题 celeba torchvision datasets
  • 深度学习分类基础概念对ACC、PPV、TPR、TNR

    举个例子 ACC 10 15 20 10 1 2 3 14 4 5 6 20 PPV 猫 10 10 1 2 解释 这里的1和2是因为狗 猪分类错误 分到了猫 PPV 狗 15 15 3 4 PPV 猪 20 20 5 6 TPR 猫 10
  • 【机器学习 & 深度学习】通俗讲解集成学习算法

    目录 集成学习 一 机器学习中的集成学习 1 1 定义 1 2 分类器 Classifier 1 2 1 决策树分类器 1 2 2 朴素贝叶斯分类器 1 2 3 AdaBoost算法 1 2 4 支持向量机 1 2 5 K近邻算法 1 3
  • 深度学习(一)

    目录 1 深度学习要解决的问题 2 深度学习应用领域 3 计算机视觉任务 4 视觉任务中遇到的问题 1 深度学习要解决的问题 机器学习流程 数据获取 特征工程 建立模型 评估与应用 深度学习跟人工智能更贴切 机器学习中的一部分 特征工程的作
  • 【torch】如何把把几个 tensor 连接起来?(含源代码)

    一 cat 在 PyTorch 中 要向一个 tensor 中添加元素 你通常需要创建一个新的 tensor 然后将元素添加到新的 tensor 中 PyTorch tensors 是不可变的 所以不能像列表一样直接追加元素 以下是如何实现
  • 笔记记录--基于ccpd数据集利用Paddle OCR训练车牌检测模型

    目录 1 环境搭建 2 数据集划分 3 训练模型 4 推理测试 1 环境搭建 安装Paddle OCR参考 创建环境 conda create n paddle env python 3 8 conda activate paddle en
  • IOU、GIOU、DIOU、CIOU、EIOU、Focal EIOU、alpha IOU损失函数分析及Pytorch实现

    IOU Loss 算法作用 Iou的就是交并比 预测框和真实框相交区域面积和合并区域面积的比值 计算公式如下 Iou作为损失函数的时候只要将其对数值输出就好了 def Iou loss preds bbox eps 1e 6 reducti
  • 【ViT(Vision Transformer)】(二) 阅读笔记

    简介 ViT是2020年Google团队提出的将Transformer应用在图像分类的模型 虽然不是第一篇将transformer应用在视觉任务的论文 但是因为其模型 简单 且效果好 可扩展性强 scalable 模型越大效果越好 成为了t
  • 卷积神经网络中用1*1 卷积有什么作用或者好处呢?

    一 来源 1312 4400 Network In Network 如果1 1卷积核接在普通的卷积层后面 配合激活函数 即可实现network in network的结构 二 应用 GoogleNet中的Inception ResNet中的
  • 浅析特征增强&个性化在CTR预估中的经典方法和效果对比

    在CTR预估中 主流都采用特征embedding MLP的方式 其中特征非常关键 然而对于相同的特征 在不同的样本中 表征是相同的 这种方式输入到下游模型 会限制模型的表达能力 为了解决这个问题 CTR预估领域提出了一系列相关工作 被称为特

随机推荐

  • (一)在Linux下命令行使用技巧

    目录 1 实验环境的管理 2 系统登陆方式 3 如何恢复系统 4 什么是内核 什么是linux 5 什么是shell 6 如何运行shell 多种方式 退出当前用户返回到登陆界面 7 shell的命令行提示符 8 shell中常见的快捷键技
  • 计算机创建快捷方式w10,win10中解决无法在桌面添加快捷方式的修复方法

    我们在win10系统电脑的使用中 电脑有时候有很多的操作出现问题我们不知道怎么做的时候 可以看一下小编的分享 我们在win10中小伙伴提问 自己想要在桌面添加润撒建的快捷方式 可是系统显示不能添加了 这是怎么回事呢 今天小编就来个的那家分享
  • 基于stm32的智能防疫门禁管理系统

    1 选题背景与意义 经过了疫情的开端与发展 就目前我国已经处在疫情的常态化管理中 在疫情常态化管理下 与人们日常生活中的出行 总离不开测温 通行证明等等 针对当前的疫情形式 我们设计一款智能防疫门禁管理系统 它能实现人们出行中测温的无人化和
  • opencv3+python3.5成语填字游戏(二)填字图片汉字提取和识别

    上一篇说的是汉字的分割 今天该实际填字图片的解析了 实际图片如下 这是一个10 10的方格 所以我们应该先提取100个小方格 然后在提取其中的汉字 用到的函数主要是python的opencv函数库里的findContours函数 用于找出图
  • Python的multiprocessing连接池

    author skate time 2014 10 13 Python的multiprocessing连接池 root skatedb55 more pool2 py usr bin env python encoding UTF 8 Au
  • the importance of a sense of community responsibility(六级真题批改网90分)

    What proves universally acknowledged is that a sense of community has caused widespread pubic attention Undoubtedly comm
  • 跨省市跳槽,社保公积金处理办法

    文章目录 前言 五险一金断缴行为分析 1 养老保险 2 医疗保险 3 工伤 失业 生育保险 4 公积金 一 方案一 二 方案二 三 方案三 总结 前言 跨省市跳槽五险一金总共有三种处理办法 此处以 武汉跳槽深圳举例 1 直接放弃武汉账户不管
  • 笔记本玩逆水寒服务器未响应,运行逆水寒电脑崩溃怎么办_逆水寒运行游戏时电脑崩溃问题解决指引_游戏吧...

    部分笔记本在运行逆水寒游戏时会出现崩溃现象 许多玩家都不知道该怎么办 如何解决这个问题 下面玩家宝宝们就和游戏吧小编一起来看一看 逆水寒 运行游戏时电脑崩溃问题解决指引吧 逆水寒 运行游戏时电脑崩溃问题解决指引 亲爱的自在同门大家好 近日
  • Android native 层用OpenGL ES在屏幕模拟流水灯

    Android native 层用OpenGL ES在屏幕模拟流水灯 Native C开发OpenGL 源码实现如下 Native C开发OpenGL 参照Android开机动画 自己实现了在native层模拟led流水灯的代码 Andro
  • matinal:SAP 批量修改主数据(客户、供应商、物料)【给所有SAP业务顾问】

    TCODE MASS 对于批量修改主数据如客户 供应商等 可以试用一下Mass 它所能修改的范围如下 选定要修改的对象后 点击运行 会要求选择需要修改的表和字段 然后填写过滤出要修改数据的条件 随后会显示所有需要修改的数据 可以在下方表格里
  • C++字符串的查找

    关于字符串的各种查找 原文出处 https www cnblogs com yongpan p 7920165 html 1 find函数 在字符串中查找子字符串中出现的位置 函数最终返回的是子字符串出现在字符串中的起始下标 该函数有两个参
  • NLP之BERT和GPT

    NLP之BERT和GPT杂谈 我们介绍了好几种获取句子表征的方法 然而值得注意的是 我们并不是只对如何获取更好的句子表征感兴趣 在评估他们各自模型性能的时候所采取的方法 回过头去进行梳理 发现 无论是稍早些的 InferSent 还是 20
  • musescore 构建入门

    musescore 1 QT上面开发 2 Qt由于版本更新 更新到QT6了 构建器由qmake 更换到cmake musescore 在QT是用cmake 构建桌面软件包 3 底层依赖库 几乎都是音频相关的库 下面是windows 系统下面
  • 求无冲突矢量集合

    在PRNET中 i发送的分组能被j正确接收的充要条件是 1 存在i j的链路 2 当i发送时 没有其他节点k发送 即不存在k j 广播形式的也算 3 i发给j时 j只处于接收状态 即j不能发给其他节点 除了上述这些原则 还有一些在做题的时候
  • Linux Ubuntu apt-get安装mysql

    自从转前端以后好久都没有和数据库打过交道了 最近在写一个node项目需要用到mysql 但是又不想在本地安装数据库 就想着在云服务器上安装了 网上百度了安装方法 大多都是去mysql官网下载官方编译好的二进制文件 这个至少都是几百M大小的安
  • 用BeanFactoryAware接口,用BEAN的名称来获取BEAN对象

    用BeanFactoryAware接口 用BEAN的名称来获取BEAN对象 applicationContext beans xml
  • Docker----Dockerfile中执行pip install 命令报 Failed to establish a new connection 错误的解决办法

    原文链接 Docker Dockerfile中执行pip install 命令报 Failed to establish a new connection 错误的解决办法 问题 在Dockerfile文件中通过RUN pip install
  • 计算机视觉2021年3月28最新论文

    编辑 AI速递 计算机视觉 3月28日 1 USB Universal Scale Object Detection Benchmark 标题 USB 万能物体检测基准 链接 https arxiv org abs 2103 14027 2
  • Connected to the target VM, address:XXXX, transport: socket

    问题 1 Connected to the target VM address 127 0 0 1 65604 transport socket 排查方案 我是最近半年多次遇到这个问题 这个就是用debug模式启动程序 方便调试 运行一半直
  • Ablation Study消融研究

    作者 飘哥 链接 https www zhihu com question 291655038 answer 683038545 来源 知乎 著作权归作者所有 商业转载请联系作者获得授权 非商业转载请注明出处 术语 消融研究 通常用于神经网