ICLR 2022最佳论文解读

2023-11-15

微信公众号“圆圆的算法笔记”,持续更新NLP、CV、搜推广干货笔记和业内前沿工作解读~
后台回复“交流”加入“圆圆的算法笔记”交流群;回复“时间序列“、”多模态“、”迁移学习“、”NLP“、”图学习“、”表示学习“、”元学习“等获取各个领域干货算法笔记~

今天给大家介绍ICLR 2022最佳论文PICO: CONTRASTIVE LABEL DISAMBIGUATION FOR PARTIAL LABEL LEARNING,这篇文章解决的是Partial Label Learning(PLL)问题,即训练数据中一个图像不是一个确定的label,而是一组可能的label集合,需要预测出每个样本的真实label。

下载地址:https://openreview.net/pdf?id=EhYjZy6e1gJ

1. 什么是Partial label learning (PLL)

有监督学习是最常见的一种机器学习问题,给定一个输入样本,预测该样本的label是什么。Partial Label Learning(PLL)问题也是预测一个样本对应的label,但是和有监督学习问题的差异是,PLL问题的训练数据中,一个输入样本对应多个候选label,真正的label是候选label中的一个。

为什么会有PLL这样的问题呢?因为在现实问题中,label来自于人工标注,而有的样本人工标注比较困难,只标注一个label会造成噪声较大的问题。例如下面的例子中,比较难区分这张狗对应的类别是哈士奇、雪橇犬还是萨摩耶,强行让人工标注成一个确定的label容易在数据中引入噪声。PLL放宽了这种限制,在标注的label中可以引入一些不确定性,给一个样本赋予多个候选label,模型学习从这些label中预测ground-truth对应的那个label。

2. PLL问题的难点

PLL的效果目前和有监督学习还有一定差距。PLL问题的难点在于标签消歧,也就是从候选label集合中预测出样本的真实label。业内一般的解法是学习样本高质量的表示,然后根据在特征空间中距离近的样本更可能属于同一类别这个假设,实现标签消歧。

然而,这种方法的问题在于,当label是一个不确定的集合而不是一个确定值时,这种不确定性也会对表示学习的过程造成负面影响。表示学习效果不好,又会对标签消歧的效果造成负面影响。

为了解决这个问题,ICLR 2022的最佳论文提出了基于对比学习的PLL问题求解方法。利用对比学习提升表示学习的效果,再利用良好的表示对label进行消歧,消歧后的label又有助于进一步生成良好的样本表征,形成良性循环,提升整体效果。

这篇文章提出的Partial label learning with COntrastive label disambiguation (PiCO) framework主要包括利用对比学习提升表示生成质量,以及基于聚类的label消歧两个核心模块。下面,我们走进这篇最佳论文,理解其背后的思想。

3. PiCO核心点1—对比学习引入PLL

第一个核心点是为了提升PLL中的表示生成效果,作者将对比学习的方法引入到PLL问题中。对比学习在有监督问题上已经取得广泛的应用,但是在PLL问题上目前还没有相关研究。将对比学习应用到PLL的一个最主要的问题是正样本对如何构造。在有监督学习中,每个样本都有其对应的确定性label,天然可以构造出正样本。而PLL问题中,每个样本的label是不确定的,无法直接获取正样本对

为了解决上述问题,本文提出利用分类器对样本的预测结果作为样本真实label(也就是伪标签persudo label),根据这个label构造正样本对。在得到正样本对后,利用MoCo对比学习框架进行表示学习,将样本的两种view分别输入两个参数共享的Encoder,其中key侧的Encoder使用动量更新的方式减小计算开销。对比学习loss作为一个辅助任务和主任吴联合学习。对MoCo等对比学习框架不了解的同学,可以参考我之前的文章:

利用对比学习,可以让样本在特征空间形成类簇,这也为后续的标签消歧奠定了基础。

4. PiCO核心点2—标签消歧

本文采用了一种类似EM算法的思路实现标签消歧。首先,对于每个类别维护一个embedding向量u,它可以视为类的类簇中心。对于每个样本的label,在PLL中也用一个N维向量表示s,N代表类别数量,表示了该样本属于每个类别的概率。接下来为了实现标签消歧,在训练过程中不断更新s,更新方法是看样本表示和哪个类别向量最近,就用滑动平均的方式对s的那一维进行更新,公式可以表示为:

相应的,类别向量u也利用滑动平均的方式进行更新,公式如下:

通过这两个步骤的迭代进行,逐步实验标签消歧。这其实和Kmean以及Kmeans++这种方法类似,本质上就是一个聚类过程。从PiCO框架整体来看,对比学习提升表示学习效果,表示质量的提升又促进了下游基于聚类的标签消歧效果,标签的确定性增加又进一步提升了表示生成的质量,形成了良性循环。

5. 实验结果

本文进行了大量实验从多个角度验证了PiCO解决PLL问题的效果。在样本表示的学习上,从下面的t-SNE向量可视化分析图可以看出,PiCO生成不用类别的向量表示非常清晰,类内的内聚性和类间的差异性相比其他方法都是更好的。

下面的实验结果对比了PiCO和和其他方法在PLL问题上的效果,可以看出PiCO要比其他方法效果有非常显著的提升。

6. 总结

本文介绍了ICLR 2022的最佳论文,在Partial Label Learning问题上的解决方法。通过这篇文章,核心是理解顶会最佳论文的设计思路,本文用的求解方法比较优雅,背后的设计思路也非常清晰,背后的思考非常值得学习。

‍微信公众号“ 圆圆的算法笔记”,持续更新NLP、CV、搜推广干货笔记和业内前沿工作解读~
后台回复“ 交流”加入“ 圆圆的算法笔记”交流群;回复“ 时间序列“、”多模态“、”迁移学习“、”NLP“、”图学习“、”表示学习“、”元学习“等获取各个领域干货算法笔记~

后台留言”交流“,加入圆圆算法交流群~

后台留言”论文“,获取各个方向顶会论文汇总~

【历史干货算法笔记】

12篇顶会论文,深度学习时间序列预测经典方案汇总

如何搭建适合时间序列预测的Transformer模型?

Spatial-Temporal时间序列预测建模方法汇总

最新NLP Prompt代表工作梳理!ACL 2022 Prompt方向论文解析

图表示学习经典工作梳理——基础篇

一网打尽:14种预训练语言模型大汇总

Vision-Language多模态建模方法脉络梳理

花式Finetune方法大汇总

从ViT到Swin,10篇顶会论文看Transformer在CV领域的发展历程

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ICLR 2022最佳论文解读 的相关文章

随机推荐

  • 9、函数知识点总结(函数概述、参数、闭包、特殊对象,js的预编译,高阶函数)

    目录 9 1 函数概述 9 1 1 函数定义 9 1 2 函数调用 9 1 3 函数提升 9 1 4 自调用函数 9 1 5 函数名后的多个括号 9 2 函数参数 9 3 js的预编译 9 3 1 函数预编译 9 3 2 全局预编译 9 3
  • 在UCGUI中增加汉字显示的说明.

    在UCGUI中增加汉字显示的说明 UCGUI中本身只支持E 没有提供中文的字库的 C源码文件 但是我们可以通过下面的方式来实现汉字的显示 我们知道 在DOS下经常利用点阵来显示汉字 带汉字显示的程序 很多都会自己带上汉字库 这个字库里放的就
  • 解决MySQL:ERROR 1045 (28000): Access denied for user ‘ODBC‘@‘localhost‘ (using password: NO)

  • 程序员必备在线代码对比工具 检查新旧代码差异化

    在工作的时候有用到代码比对工具 用来检查功能调试的时候功能迭代的时候出现故障 希望检查和原始代码到底有什么区别 因此 老蒋本来今天打算整理8 10个在线代码对比工具的 但是考虑到我们在选择工具的时候 在众多工具中选择一款适合自己的即可 否则
  • iOS应用内支付(内购)的个人开发过程及坑!

    本文会给大家详细介绍iOS内购 这是本人16年5月底的开发过程 希望对看完此篇文章的人有所帮助 本文基于XcodeVersion 7 3 7D175 版本 手机是iPhone 6 9 3系统 部分地方直接摘自网络 基本上是我的逻辑 省时省心
  • MP4文件格式详解——结构概述

    http blog csdn net pirateleo article details 7061452 MP4文件格式详解 ISO 14496 12 14 Author Pirate Leo Email codeevoship gmail
  • python毕业设计 大数据房价数据分析及可视化 房价分析

    文章目录 1 课题背景 2 数据爬取 2 1 爬虫简介 2 2 房价爬取 3 数据可视化分析 3 1 ECharts 3 2 相关可视化图表 1 课题背景 房地产是促进我国经济持续增长的基础性 主导性产业 如何了解一个城市的房价的区域分布
  • 【Linux】权限

    Linux基本权限 权限 人 事物属性 文章目录 Linux基本权限 文件属性 用户 文件权限 目录权限 结束语 文件属性 目录dir和文件me txt前最开始的d和 是文件属性 例如 中间的横线 普通文件 文本 可执行文件 归档文件等 d
  • Java学习(11):Java实现图书馆书库管理系统

    接上次博客 Java学习 10 多接口 接口的继承 抽象类和接口的区别 Object类 toString equals hashcode 接口实例 compareTo clone 浅拷贝和深拷贝 内部类 di Dora的博客 CSDN博客
  • LocalDateTime和Date得转换

    Java8 LocalDateTime获取时间戳 毫秒 秒 LocalDateTime与String互转 Date与LocalDateTime互转 LocalDateTime获取时间戳 毫秒 秒 LocalDateTime与String互转
  • vue3中JSX结合h()函数的用法简记

    vue3中JSX结合h 函数的用法简记 1 起因 为了实现表单设计通过左侧拖拽展示不同的组件 且这些组件内都渲染着一个公用的文本方法 删除和复制的功能 封装成一个组件CopyDelete 于是用到了如何通过h 函数将CopyDelete插入
  • 改变antd-mobile中Modal的进入方式

    增加属性maskTransitionName 和 transitionName maskTransitionName zoom transitionName zoom zoom样式是 scale 0 2 scale 1 参考文档
  • XML语言

    XML XML是可扩展的标记语言 标记语言 通过标签来描述数据的一门语言 标签有时我们也将其称之为元素 可扩展 标签的名字是可以自定义的 XML文件是由很多标签组成的 而标签名是可以自定义的 xml学习网站https www w3schoo
  • p51 thinkpad 拆解_ThinkPad P51自己加装内存操作图解

    把全部螺丝拧松之后 从缺口发力 分别沿着两个方向逐步拉开盖板 最终把整个盖板拆下来 第二步 拆键盘螺丝 打开大盖板之后 还有三个键盘螺丝要拆 具体位置如图所示 图片看不清的话 注意查看螺丝附近的标记 看到是键盘标记的就拆下来就对了 这是三根
  • 安装 jupyter 和 numpy,并运行jupyter,完成numpy的不少于10道的基础练习,熟悉矩阵运算。

    文章目录 一 安装Anaconda 1 在Anaconda Navigator中无法打开jupyter 二 使用jupyter notebook完成编程 1 引入库 2 基础练习 三 总结 四 引用 一 安装Anaconda 在官方网站即可
  • 微信小程序组件的传参

    父子关系 1 父向子传参 子组件 通过 properties 声明要从父组件中接收的数据 组件的属性列表 properties tabId String 父组件 通过自定义属性的形式传递数据 以子组件中定义的 key 为属性名 以要传递的数
  • 等保2.0二级安全要求

    第二级安全保护能力 应能够防护免受来自外部小型组织的 拥有少量资源的威胁源发起的恶意攻击 一般的自然灾害 以及其他相当危害程度的威胁所造成的重要资源损害 能够发现重要的安全漏洞和处置安全事件 在自身遭到损害后 能够在一段事件内恢复部分功能
  • Android中字母大小写切换的快捷键

    1 选中要切换到字母 eclipse ctrl shift x 转为大写 ctrl shift y 转为小写 2 Androidstudio字母大小写切换用一下方法或直接使用快捷键 大小写转换 Cmd Shift U Ctrl Shift
  • 使用Docker-compose部署redis主从

    废话少说 直接来上docker compose yaml文件 切记格式 version 2 networks myweb external name mysql docker compose myweb services redis mas
  • ICLR 2022最佳论文解读

    微信公众号 圆圆的算法笔记 持续更新NLP CV 搜推广干货笔记和业内前沿工作解读 后台回复 交流 加入 圆圆的算法笔记 交流群 回复 时间序列 多模态 迁移学习 NLP 图学习 表示学习 元学习 等获取各个领域干货算法笔记 今天给大家介绍