【Transformer】18、ACMix:On the Integration of Self-Attention and Convolution

2023-10-26

在这里插入图片描述

一、背景和动机

卷积核自注意机制是两个很有效的特征提取方法,但这两个方法通常被认为是两种不同机制的方法。

卷积方法是对局部进行特征抽取,全局特征共享,自注意力方法是全局像素的权重提取。

本文作者认为这两者有很强的底层关系,所以从大范围上来说,这两者的计算机制是类似的。

之前也有一些工作将这两者进行结合,如:

  • SENet,CBAM 等则说明了自注意机制可以对卷积网络模型起到帮助。
  • SAN,BoTNet 等使用自注意模型来代替卷积操作
  • AA-ResNet,Container 等将两者进行了结合,但两个模块分别使用了不同的 path,所以本质上还是分别使用了两种机制。

所以,两者之间的底层联系其实还没有被完全探索

基于此,作者开始了探索两者之间的关系

分解两者之后,作者认为他们都是依赖于 1x1 卷积的,所以作者提出了一个混合模型——ACMix,将两者结合在一起。

二、方法

1、将输入特征使用 1x1 卷积映射为中间特征

2、将该中间特征分别使用自注意和卷积进行处理

在这里插入图片描述

ACMix 的过程如图2c所示:

Stage 1:使用 3 个 1x1 卷积,将输入映射为 3 种不同的特征,并将没种特征切分为 N pieces,此时就得到了 3xN 个中间特征

Stage 2:对 Stage 1 得到的中间特征分别处理

  • self-attention path:将中间特征聚合为 N 个组,每个组中包含了 3 个 pieces,每个 pieces 都来自于不同的 1x1 卷积产生的特征。然后将这 3 个 pieces 的特征用作 q、k、v,输入多头自注意模块中。
  • convolution path:使用全连接层产生 k 2 k^2 k2 个特征图,然后通过平移和聚合,产生和卷积相同的效果。

最后,使用如下方法聚合两者:
在这里插入图片描述

在这里插入图片描述

三、效果

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【Transformer】18、ACMix:On the Integration of Self-Attention and Convolution 的相关文章

  • 单例模式实现

    单例模式 一个类在任何情况下都绝对只有一个实例 并提供一个全局访问点 单例模式是创建型模式 单例模式的应用场景 某类只要求生成一个对象的时候 如一个国家主席 班级班长等 单例模式的好处 由于单例模式只允许创建一个对象 共享该对象可以节省内存
  • 关于高通AR摄像机聚焦和调用前后摄像头的研究

    我们在做高通AR的时候会有一些设置的图片无法识别的情况 怎么解决呢 Vuforia有个Target Manager 这里主要负责处理待识别的Target 在最新的4 0版本中 可识别的标志包括以下四种类型 一般使用较多的是Single Im
  • k8s 读书笔记 - 深入掌握 Pod 扩缩容

    Pod 扩缩容的应用场景 在实际生产环境中通常会遇到某个服务需要扩缩容的场景 某个 Service 服务资源紧张 需要对其进行扩容 比如服务请求的负载突然增加 原本一个 Pod 副本开始吃不消 此时需要多扩展几个 Pod 副本来分担突发的负

随机推荐

  • dnsmasq搭建dns

    dnsmasq服务端 安装 yum y install dnsmasq 改配置文件 root yum nfs egrep v etc dnsmasq conf resolv file etc resolv dnsmasq conf stri
  • 示例:统计IP地址对应的省份,并把结果存入到mysql

    ip txt access log import java io BufferedReader FileInputStream InputStreamReader import java sql Connection DriverManag
  • vscode利用ssh远程连接linux虚拟机

    1 vscode是利用ssh远程连接linux的 所以首先确保vscode已经安装了这两个插件 2 点击左下角的连接 3 选择Connect to Host 4 选择添加新的主机 5 按格式输入 ssh 主机名 ip 比如我的 ssh du
  • python list列表操作进阶

    1 list基础介绍 在Python中 list是一种非常重要并且使用也非常广泛的数据类型 可以存储任意数量的有序元素 list可以包含不同数据类型的元素 如整数 浮点数 字符串等 并且可以随时添加或删除其中的元素 使得它在处理动态变化数据
  • Windows小技巧12--永久关闭开机弹出的今日热点

    Windows小技巧12 永久关闭开机弹出的今日热点 1 异常概述 2 解决方法 3 说明 1 异常概述 笔者最近打开Windows 发现总会自动弹出一个未知的今日热点 如下图 即便设置了永久不再弹出 下次开机的时候也会弹出 并且会随机发各
  • windows 安装Python2.7

    Win7 Python2 7 安装教程 Win7 Python2 7 安装过程如下 1 到 官方网站 下载安装文件包Python 2 7 10 amd64 msi 根据自己的电脑配置选择相应的安装包 点击安装即可 默认安装在C Python
  • DOM——页面的渲染、style属性操作、预加载与懒加载、防抖与节流

    一 页面的渲染 一 浏览器加载一份HTML文档的加载过程 1 把标签 文本 注释 属性等html代码解析为节点树 DOM Tree 2 把所有样式 css代码和浏览器自带 解析为结构体 3 把css样式结构体和节点树结合变成呈现树 渲染树
  • 学生考试信息管理系统c语言程序,C语言版学生信息管理系统

    本文实例为大家分享了C语言版学生信息管理系统的具体代码 供大家参考 具体内容如下 一 题目分析 1 功能概述 1 查询学生信息 2 添加学生信息 3 修改学生信息 4 删除学生信息 5 刷新学生信息 6 保存学生信息 7 输出当前学生信息
  • 简单的Kali Linux学习教程

    第一步 安装Kali Linux 您可以从Kali Linux官方网站下载Kali Linux的安装镜像文件 安装程序提供了多种选项 包括在磁盘上安装 在虚拟机中运行等 第二步 更新系统 安装完成后 首先需要通过以下命令更新系统 sudo
  • 【思特沃克前端校招笔试、一面、二面】

    思特沃克 1 前端海外岗 四月中旬收到笔试 写完后几天约一面 一面后两周约二面 2 大概两周后收到邮件答复一面过了约二面 结果点约面链接进去没有显示 通过该邮件咨询了下只要等待下次邀约就行 3 结果几天后收到了感谢信 邮件咨询校招组也无回应
  • 基于bp神经网络的房价预测,房价预测 神经网络

    Python 与深度学习有哪些与建筑设计相接轨的可能性 关注这个问题快一周了 到目前来说还是没发现什么太大的惊喜 我感觉建筑设计界还是要学习一个 不要看到深度学习很火 就弄个大新闻 把这玩意往建筑设计上搬呀 其实深度学习这事儿到底怎么就能和
  • LightGBM 源码学习 (2022-5)

    之前在Linux系统上调试的博文 LightGBM源码学习 准备篇 系统 MacOS 软件 Clion 感觉最新的commit可能有坑 退回到2021年年初的commit code link git checkout 967b45c6866
  • 【爬虫自动生成代码】Playwright系列文章二

    Playwright系列文章 目录 Playwright系列文章 前言 一 Playwright录制功能 二 使用步骤 1 查看命令参数 help 2 命令启动浏览器 总结 前言 Playwright是类似于selenium Pyppete
  • android support design jar,错误:程序类型已存在:android.support.design...

    我在构建项目时遇到以下错误 在这个项目中没有使用CoordinatorLayout 刚刚在build gradle中添加为依赖项 我使用的是Android Studio 3 2 Canary 4 logcat的 AGPBI kind err
  • uv纹理坐标设定与贴图规则

    1 什么是UV 对于三维模型 有两个最重要的坐标系统 一是顶点的位置 X Y Z 坐标 另一个就是UV坐标 什么是UV 简单的说 就是贴图影射到模型表面的依据 完整的说 其实应该是UVW 因为XYZ已经用过了 所以另选三个字母表示 U和V分
  • VUE 时间转换的几种方式

    时间转换 做一个项目肯定会关系到很多的数据类型 数据类型之间都是可以转化的 前端有时候从后端拿到的时间不符合标准 此时就需要转换以后再去使用 转换有两种方式 看你个人比较喜欢哪一种 这里已时间转换为例子 过滤器filter 全局过滤器 在m
  • unity 发布webGl ISS发布

    推荐 https blog csdn net weixin 43926289 article details 122943814 其他的按照步骤配置就行了 主要是 一定要按图来 OVER 另外说一下本地浏览器直接打开index 有些项目要求
  • mysql服务器多线程参数_MySQL服务器的线程数查看方法

    MySQL的variables和status是管理维护的利器 就类似Oracle的spfile和v 表 MySQL通过系统变量记录很多配置信息 比如最大连接数max connections mysql gt show variables l
  • Java从零开始追大牛系列_0

    在此先做做我介绍 鄙人二流大学通信工程专业一名大三 即将大四 学生 由于并无志向在专业学术领域有所建树 因此并未涌入考研大军 只求毕业后Java编程技术过硬 可寻的一份喜欢的工作 特此准备写词系列博客 因为软件并非自己专业 只是兴趣使然 但
  • 【Transformer】18、ACMix:On the Integration of Self-Attention and Convolution

    文章目录 一 背景和动机 二 方法 三 效果 一 背景和动机 卷积核自注意机制是两个很有效的特征提取方法 但这两个方法通常被认为是两种不同机制的方法 卷积方法是对局部进行特征抽取 全局特征共享 自注意力方法是全局像素的权重提取 本文作者认为