SimSiam：Exploring Simple Siamese Representation Learning

2023-11-19

Siamese网络最大化了一个图像的两个增强之间的相似性，服从于避免崩溃解的某些条件。在本文中，SimSiam即使 不使用以下任何一项也可以学习有意义的表示:(i)负样本对，(ii)大批量，(iii)动量编码器。我们的实验表明，停止梯度stop-gradient 运算在防止崩塌中起着重要作用。

Siamese 网络是应用于两个或多个输入的 权重共享 神经网络。它们是比较(包括但不限于“对比”)实体的自然工具。最近的方法将输入定义为一幅图像的两个增强，并根据不同的条件 最大化相似性。我们的模型直接最大化了一张图像的两个增强视图的相似性，既不使用负对，也不使用动量编码器。它适用于典型的批量大小，不依赖于大批量训练。停止梯度操作（图 1）对于防止崩溃解决方案至关重要。我们假设隐含着两组变量，而 SimSiam 的行为就像在优化每组变量之间交替进行。权重共享的Siamese网络可以对关于更复杂的转换（例如，增强）的 不变性 进行建模。

在实践中， 对比学习方法受益于大量的负样本[34,33,17,8]。这些样本可以保存在记忆库memory bank中[34]。在 Siamese 网络中，

· MoCo [17] 维护一个 负样本队列 ，并将一个分支变成动量编码器，以提高队列的一致性。

·在 SimCLR [8]中实例化的，排斥不同的图像(负对)，同时吸引同一图像的两个视图(正对)。负对排除了来自解空间的恒定输出。SimCLR 直接使用当前批次中共存的负样本，并且 需要较大的批次大小才能正常工作 。

·除了对比学习和聚类之外， BYOL [15] 仅依赖于正对，但在使用 动量编码器的情况下它不会崩溃。BYOL直接从另一个视图预测一个视图的输出。它是一个Siamese网络，其中一个分支是动量编码器。 我们发现停止梯度操作至关重要。虽然移动平均行为可以通过适当的动量系数提高准确性，但 我们的实验表明它与防止塌陷没有直接关系。

MoCo和 BYOL 不直接共享两个分支之间的权重，我们将这些模型视为具有 “间接”权重共享的连体网络。

SimSiam、SimCLR [8] 和 SwA V [7]都是 直接共享权重的Siamese网络，但 SimCLR 和 SwAV都需要大批量（例如 4096）才能正常工作。

对比学习[16]的核心思想是吸引正样本对并排斥负样本对。

·无监督表示学习的另一类方法是 基于聚类[5,6,1,7]。他们在对表示进行聚类和学习预测聚类分配之间交替进行。 SwAV [7] 通过从一个视图计算分配并从另一个视图预测它，将聚类合并到一个Siamese网络中。与对比学习一样，基于聚类的方法需要内存库 [5, 6, 1]、大批量 [7] 或队列 [7] 来为聚类提供足够的样本。

当批次太大时（即使在监督学习中），标准 SGD 优化器效果不佳。我们期望一个专门的优化器（例如，LARS [36]）在这种情况下会有所帮助。但是，我们的结果表明， 不需要专门的优化器来防止崩溃。

总之，我们观察到 BN 在适当使用时有助于优化，这类似于 BN 在其他监督学习场景中的行为。但是我们没有 看到任何证据表明 BN 有助于防止崩溃。

这表明崩溃预防行为不仅仅与余弦相似度有关，也不依赖于对称。对称化有助于提高准确性，但与防止塌陷无关。

在所有情况下，SimSiam都比 SimCLR 有更好的结果。

表5中的这些方法的共同结构是Siamese网络。这种比较表明，Siamese结构是他们普遍成功的核心因素。

与其他无监督方法的关系：

1.SimCLR 依靠负样本（“差异性”）来防止崩溃。 SimSiam 可以被认为是“没有负样本的 SimCLR”。

2.SimSiam 在概念上类似于“没有在线集群online clustering的SwAV”。

3.SimSiam 可以被认为是“没有动量编码器的 BYOL”，但存在许多实现差异。

最近方法的Siamese形状可能是其有效性的核心原因。Siamese网络是用于建模不变性的自然而有效的工具，这是表示学习的重点。我们希望我们的研究能够引起对Siamese网络在表征学习中的基本作用的关注。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

SimSiam：Exploring Simple Siamese Representation Learning 的相关文章

【图像融合】基于联合双边滤波和局部梯度能量的多模态医学图像融合研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码图像文章
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【多源数据融合】基于Dempster-Shafer理论的信念对数相似度测量及其在多源数据融合中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
问CHAT很繁琐的问题会不会有答案呢？

问CHAT 什么已有的基于极值理论的极端温度重现期主要针对极端高温事件对极端低温事件研究较少 CHAT 回复为这主要可能是由于以下几个原因 1 气候变化与全球变暖当前全球变暖和气候变化的问题备受关注这导致科研者更加关注极端高温事件
用CHAT写一份标题为职业教育教师教学能力提升培训总结

CHAT回复标题职业教育教师教学能力提升培训总结一活动概述本次由学校组织的职业教育教师教学能力提升培训于8月15日至8月20日顺利进行来自全校的60位职业教育教师参与了此次培训主讲人为享有盛名的教育专家马丁先生二培训内容与
让CHAT介绍下V2ray

CHAT回复 V2Ray是一个网络工具主要用于科学上网和保护用户的网络安全它的名字源自Vmess Ray 光线通过使用新的网络协议为用户提供稳定且灵活的代理服务下面是一些V2Ray的主要特性 1 多协议支持 V2Ray 提供了大量
打造完美人像，PixCake像素蛋糕助您一键修图

您是否曾经为自己的人像照片需要进行繁琐的修图而感到困扰是否曾经想要打造出完美的自拍照却不知道该如何下手现在我们为您推荐一款强大的人像处理技术修图软件 PixCake像素蛋糕 PixCake像素蛋糕是一款基于AI人像处理技术的修图软件
活动日程&直播预约｜智谱AI技术开放日 Zhipu DevDay

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入直播预约通道关于AI TIME AI TIME源起于2019年旨在发扬科学思辨精神邀请各界人士对人工智能理论算法和场景应用的本质问题进行探索加强思想碰撞链接全球AI学
明日 15:00 | NeurIPS 2023 Spotlight 论文

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入哔哩哔哩直播通道扫码关注AITIME哔哩哔哩官方账号预约直播 1月17日 15 00 16 00 讲者介绍黄若孜腾讯AI LAB游戏AI研究员 2020年复旦大学硕士毕业后
毕业设计：基于卷积神经网络的验证码识别系统机器视觉人工智能

目录前言设计思路一课题背景与意义二算法理论原理 2 1 字符分割算法 2 2 深度学习三检测的实现 3 1 数据集 3 2 实验环境搭建 3 3 实验及结果分析最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实
毕业设计：基于卷积神经网络的图像分类系统 python人工智能

目录前言设计思路一课题背景与意义二算法理论原理 2 1 卷积神经网络 2 2 SVM算法三检测的实现最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力
2024 人工智能与大数据专业毕业设计(论文)选题指导

目录前言毕设选题选题迷茫选题的重要性更多选题指导最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生
强烈推荐收藏！LlamaIndex 官方发布高清大图，纵览高级 RAG技术

近日 Llamaindex 官方博客重磅发布了一篇博文 A Cheat Sheet and Some Recipes For Building Advanced RAG 通过一张图给开发者总结了当下主流的高级RAG技术帮助应对复杂的生产场
如何快速申请GPT账号？

详情点击链接如何快速申请GPT账号一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Gemini以及大模型
2023最新pytorch安装（超详细版）

前言一判断是否有Nvidia 英伟达显卡二 CPU版 2 1 安装Anaconda 2 2 创建虚拟环境 2 3安装pytorch 2 4 验证pytorch是否安装成功三 GPU版 3 1 安装Anaconda 3 2 创建虚拟环
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
深度学习：人脸识别系统 Tensorflow 人脸检测 Python语言 facenet人脸识别算法毕业设计（源码）✅

博主介绍全网粉丝10W 前互联网大厂软件研发集结硕博英豪成立工作室专注于计算机相关专业毕业设计项目实战6年之久选择我们就是选择放心选择安心毕业感兴趣的可以先收藏起来点赞关注不迷路毕业设计 2023 2024年计算机毕业
基于节点电价的电网对电动汽车接纳能力评估模型研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
国产化率100%，北斗导航单日定位4500亿次，外媒：GPS将被淘汰

追赶30年的技术差距国产卫星导航系统北斗开始扬眉吐气数据显示北斗导航目前单日定位量达4500亿次已经获得100多个国家的合作意向甚至国际民航也摒弃以往独宠 GPS的惯例将北斗纳入参考标准对此有媒体直言 GPS多年来的技

随机推荐

VS2017 NuGet包管理

一在 https www nuget org 注册账号并生成APIKEY 二在命令行窗口启动nuget exe 三生成 nuspec文件将nuget exe放置在项目目录注意下图处的id version 打包后会生成 id ve
C/C++ int a[]和int (*a)[]的区别

int a a与先结合 a为数组数组element type int int a a与先结合 a为指针指向数组同int a link https www jianshu com p 548ff8e1b243
CentOS7修改SSH端口

CentOS7 修改SSH端口文章目录 CentOS7 修改SSH端口 1 修改ssh配置文件 1 1 查看默认端口 1 2 修改端口 2 防火墙放行 2 1 查看防火墙状态 2 2 防火墙放行端口 202 2 3 查看已开启端口 2 4
svn客户端检出的工程导入eclipse后不显示SVN信息

1 首先确定原因是由于SVN客户端与SVN插件版本不对应导致的因此需要更换SVN插件版本 1 1 SVN插件与SVN客户端版本对应关系插件svn1 4 x对应TortoiseSvn 1 5 x 插件svn1 6 x对应Tortoise
Keil MDK编程环境下的 STM32 IAP下载（学习笔记）

IAP下载 IAP的引入不同的程序下载方式 ICP ICP In Circuit Programing 在电路编程可通过 CPU 的 Debug Access Port 烧录代码比如 ARM Cortex 的 Debug Interf
Jsp页面java.lang.NumberFormatException: For input string: ““错误解决办法

Jsp页面报Java lang NumberFormatException For input string 错误解决办法昨天写代码遇到一个错误在日志和控制台报一个错误说jsp页面一个出现java lang NumberFormatEx
React-Router V6 使用详解

一基本用法 React Router的安装方法 npm npm install react router dom 6 yarn yarn add react router dom 6 目前官方从5开始已经放弃原有的react router
Java中Date日期处理类，Calendar日期类，SimpleDateFormat

1 date 获取当前系统时间 date getTime 获取系统时间毫秒值 package import java util Date public class DateDemo public static void main Strin
Java 多线程模式 —— Guarded Suspension 模式

Part1Guarded Suspension 模式的介绍我们只从字面上看 Guarded Suspension 是受保护暂停的意思 1Guarded Suspension 模式在实际的并发编程中 Guarded Suspension
【开源电机驱动】符号-幅值驱动方式

原文地址 http www modularcircuits com blog articles h bridge secrets sign magnitude drive 本文为翻译校正稿件含有译者个人理解 Sign Magnitude
Edge兼容性错误

Edge兼容性错误搜索错误 STATUS INVALID IMAGE HASH 修改注册表进入 HKEY LOCAL MACHINE SOFTWARE Policies Microsoft Edge 没有就新建然后新建DWORD 32
Vue中鼠标悬停更换图片/文字内容，动态展示/修改某些属性

Vue中鼠标悬停更换图片文字内容动态展示修改某些属性鼠标悬停时 mouseenter 鼠标离开时 mouseleave 利用以上来绑定相应方法例如 div 分别为鼠标悬停时和离开时绑定方法changeImageSrc 并传递参数
GBase 8s内置数据类型—大对象数据类型

大对象数据类型大对象数据类型已定义表与大对象存储分开大对象是逻辑存储在表列中但物理存储与列无关的数据对象大对象是独立于表存储的因为它们通常存储大量的数据将此数据与表分开可提高性能大对象分为简单大对象和智能大对象简单大对象又分为B
MyBatis 学习笔记（四）---源码分析篇---配置文件的解析过程（一）

概述前几篇我们介绍了MyBatis的一些基本特性对MyBatis有了个初步了解接下来我们将着手来分析一下MyBatis的源码从源码层面复盘MyBatis的执行流程思维导图概括配置文件解析过程分析有了上述思维导图我们对配置文
jar包远程调试

以冰蝎为例新建一个Java项目将冰蝎的jar包拷贝进lib文件夹需要创建一个lib文件夹右键选择Add as Library 编辑配置添加远程jvm调试在其jar文件夹下打开cmd窗口运行如下命令 java agentlib
matlab求矩阵均值、标准差、最大值以及reshape（）函数

1 读入图像矩阵求矩阵均值的方法 gt gt a 1 2 3 4 5 6 7 8 9 a 1 2 3 4 5 6 7 8 9 gt gt mean a 1 求矩阵的所有列的均值 ans 4 5 6 gt gt mean a 求矩阵的所有
cas5.3.2单点登录-Cas Server开启Oauth2.0协议(二十)

原文地址转载请注明出处 https blog csdn net qq 34021712 article details 82290876 王赛超学习Cas这么久了一直在按照CAS自身的协议接入 Cas的强大在于有官方的插件可以支持其
修改代码后，刷新页面没有更新的解决办法。Disable cache禁止缓存

工作内容不对外开放很多时候我们修改代码并保存后到浏览器看效果发现并没有更新刷新页面后也没有更新可能是你的缓存开启了 Network 里勾选Disable cache重新加载页面后会发现浏览器使用缓存了打开Disable c
Vue中高德地图获取经纬度及逆地理解析的两种方式CDN或NPM(协议必须是https) 否则定位会一直失败

高德地图获取经纬度 npm方式 npm i amap amap jsapi loader save import AMapLoader from amap amap jsapi loader npm方式 export function NP
SimSiam：Exploring Simple Siamese Representation Learning

Siamese网络最大化了一个图像的两个增强之间的相似性服从于避免崩溃解的某些条件在本文中 SimSiam即使不使用以下任何一项也可以学习有意义的表示 i 负样本对 ii 大批量 iii 动量编码器我们的实验表明停止梯度stop

SimSiam：Exploring Simple Siamese Representation Learning

SimSiam：Exploring Simple Siamese Representation Learning 的相关文章

随机推荐

热门标签