元学习每日学习之路

2023-05-16

参考视频
【2.21】元学习：学会如何去学习，就是带着这种对人类这种“学习能力”的期望诞生的。Meta Learning希望使得模型获取一种“学会学习”的能力，使其可以在获取已有“知识”的基础上快速学习新的任务，如：

让Alphago迅速学会下象棋
让一个猫咪图片分类器，迅速具有分类其他物体的能力

优点：
让学习更加有效率。我们通过多个task的学习，使得模型学习其他task时更加容易。
样本数量比较少的任务上，更加需要有效率的学习，从而提升准确率和收敛速度。meta learning是few shot learning的一个比较好的解决方案

一般的机器学习任务，我们是需要学习一个模型f，由输入x得到输出y。而meta learning，则是要学习一个F，用它来学习各种任务的f。如下图
在这里插入图片描述

分类：
单任务元学习：在这里插入图片描述往常深度学习流程，现在考虑能否学F？

在这里插入图片描述
W称为元知识；fw是指适合数据的算法；fθ代表分类模型

多任务的元学习算法
在这里插入图片描述

支撑集用于元训练学习w
用的验证集（查询集）数据计算损失用于学习θ

分类：

在这里插入图片描述

基于优化的
基于权重参数初始化的
基于模型的

基于优化的元学习：
在这里插入图片描述
在进行参数学习时，不是通过一定的规则（SGD Adam）而是通过学习的方式寻找参数

【2.22】模型参数初始化元学习：
模型无关元学习(MAML)
在这里插入图片描述
步骤：
①外层循环：随机抽取任务进入内层循环
②内层循环：选取K个样本，基于随机初始化的θ进行微调得到θ’
③在查询集评估模型
④一直到收敛

MAML loss function如下：所有task的testing set上的loss之和，即为MAML的Loss，我们需要最小化这个loss。通过gradient descent的方法就可以实现。
在这里插入图片描述
MAML更新参数的过程如下所示

初始化meta learning参数φ0
由φ0梯度下降一次，更新得到θm
在task m上更新一次参数（微调）
通过第二次θ的方向，确定φ的更新方向，得到φ1。
而对于model pretrain，其φ和θ的更新始终保持一致。
在这里插入图片描述

MAML的创新点在于，训练模型时，在单个任务task中，模型参数只更新一次。李宏毅老师认为主要原因是：
MAML希望模型具有单个task上，参数只更新一次，就可以得到不错初始化参数的能力
meta learning的数据集一般都是few shot的，否则很多task，训练耗时会很高。而few shot场景下，一般模型参数也更新不了几次
虽然在训练模型时只更新一次初始化参数，但在task test时，是可以更新多次参数，让模型充分训练的
meta learning一般会包括很多个task，单个task上只更新一次，可以保证学习效率。

Reptile
Reptile和MAML一样，也是focus在模型参数初始化上。故loss function也基本相同。不同之处是，它结合了pretrain model和MAML的特点，在模型参数更新上有所不同。Reptile也是先初始化参数φ0，然后采样出任务m，更新多次（而不是MAML的单次），得到一个不错的参数θm。利用θm的方向来更新φ0到φ1。同样的方法更新到φ2
在这里插入图片描述

小样本学习(few shot learning)
n-way-k-shot架构（n类每类中取出k样本）
根据类来切分数据集

与预训练模型的区别
主要区别在于计算损失函数时区别不一样
在这里插入图片描述
MAML要求更新一步后θ做得好
pre-trained要求学习时θ本身做的好

权重元学习：
在学习样本时给每个样本赋一个权重，有的样本难以学习，有的样本比较好学习

数据集蒸馏：
把支撑集作为元知识，模型效果不好时，算法不动，改变数据集，使得效果较好。

参考文章

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

元学习每日学习之路的相关文章

Spring cloud gateway 设置https 和http同时支持

Spring cloud gateway 处理跨域问题 Spring cloud gateway 拦截请求404 等HTTP 状态码 Spring cloud gateway 修改response 截断问题 xff0c 乱码问题解决 Spr
一场HttpClient调用流未关闭引发的java 程序假死

生成环境突然假死 xff0c nginx 也打不过去 xff0c nnnnnnnn 以为是启动时间久了 xff0c 随手在启动 xff0c 没过几分钟程序继续假死 xff0c 查看nginx 日志有很多请求 xff0c 所以问题无法进行
列表拖拽，上下移动 java 接口实现

列表拖拽实现上下移动实现列表拖拽实现拖拽的逻辑 xff1a 按住某一个id 拖拽到需要移动的某个后面如 xff1a 1 2 3 4 5 把 1 放到5的后面列表改变顺序后变成 2 3 4 5 1 所以目前的代码实现逻辑为把1 挨
CentOS8安装Mysql提示Error: Unable to find a match

yum y install mysql community server Last metadata expiration check 0 13 40 ago on Sun 26 Apr 2020 11 20 57 AM CST No ma
常见协议的默认端口

常见协议的默认端口 1 HTTP协议 xff0c 服务器的默认端口号为 xff1a 80 2 HTTPS协议 xff0c 服务器默认的端口号为 xff1a 443 3 Telnet协议 xff0c 服务器默认的端口号为 xff1a 23 4
锐捷交换机基本配置命令

show ip interface brief 查看当前配置的ip地址 enable password admin 给enable配置密码 switchport trunk allowed vlan all 允许全部vlan通过 xff1f
一道经典的数据库sql语句题目

SQL查询题目 lt 列表视图页显示缩略图和文章摘要 gt lt 文章视图页显示全部内容 gt lt 如果有内容 xff0c 显示内容 gt SQL查询题目条件 xff1a Student Sno Sname Sage Ssex 学生表
OpenCv+VS2017图像处理入门（一）

安装VS2017 Visual Studio官网下载社区版VS2017 xff0c 安装教程照着网上做即可安装OpenCv 官网下载opencv3 3 0 vc14 exe 3 配置OpenCv环境 xff08 1 xff09 计算机环境
模板编程：C++11 可变模版参数的使用(逗号表达式、可变长数组、C#的委托实现)

转载 xff1a 泛化之美 C 43 43 11可变模版参数的妙用 qicosmos 江南博客园 cnblogs com 重点 xff1a 1 template lt class T gt 和template lt typenameT g
Qt------自定义标题栏(最小化、最大化、关闭、边框拉伸、拖动)

转载 xff1a Qt之界面 xff08 自定义标题栏无边框可移动缩放 xff09 我不是萧海哇的博客 CSDN博客参考了两篇文章处理 xff0c 还有半屏没处理 xff0c 就是左右边框的时候半屏重点 xff1a 1 拖动需要
服务器多解决方案编译

服务器上的编译方法可以有多种 xff0c 其中一种方案是采用多解决方案服务器编译项目采用的是多解决方案并行编译 xff0c 而本地编译是根据依赖顺序进行顺序编译多解决方案的优点 xff1a 一般来说 xff0c 服务器端的软件较为复杂
OCC的模型的拓扑结构描述

如下图所示一个构件由两个面构成拓扑结构的描述如下图所示 xff1a Shape gt 面 gt 线框 gt 边 gt 点
AutoCad二次开发原理

重点 xff1a 1 AutoCad主要是三部分组成 xff1a 数据建模渲染 2 二次开发AutoCad在建模方面只提供少量的建模接口 xff0c 其中autocad提供ACIS的shell和mesh接口 xff0c 不够使用需要单
Android Studio新建工程默认在build.gradle中加入maven阿里源

背景 xff1a 在安卓开发时 xff0c 我们时常会因为gradle Sync时间漫长感到烦恼通常情况下我们会在build gradle Project MyApplication 中的repositories里添加阿里源 xff0c
C语言进阶（六）：指针数组字符串函数

目录一指针的本质分析 1 号的意义 xff08 1 xff09 指针的声明和使用 xff08 2 xff09 实践 xff1a 指针使用示例 2 传值调用与传址调用 xff08 1 xff09 什么是传值调用 xff0c 传址调用 xf
单片机核心学习：（六）串口UART编程(STM32F103)

目录一硬件知识 UART硬件介绍 1 串口的硬件介绍 2 串口的参数 xff08 1 xff09 怎么发送一字节数据 xff0c 比如 A xff08 2 xff09 逻辑电压 3 串口电平 4 串口内部结构二 STM32F103 U
TortoiseSVN Client使用说明

1 TortoiseSVN的安装当前使用的TortoiseSVN为 xff1a TortoiseSVN 1 14 1 29085 x64 svn 1 14 1 msi xff0c 下载安装地址 xff1a Downloads Tortoi
网易云音乐缓存音乐/视频文件的解密操作

现在播放器的缓存都会进行一定的操作用户不能简单的通过修改缓存文件名来获取源音乐视频文件一般而言 xff0c 即使找到缓存文件并用播放器打开 xff0c 依然不能正常播放经过笔者小小的观察 xff0c 发现云音乐的缓存文件加密算法十分
Linux 网络开发必学课程（一）网络编程的概念与模式、服务端编程初体验

1 网络编程的概念与模式网络编程的本质使用操作系统提供的接口函数 xff0c 使得应用程序具备收发网络数据的能力网络接口在代码层面是操作系统提供的函数网络编程只是一系列系统函数的花式玩法应用程序通过网络接口使用操作系统的联网能力
Linux 网络开发必学课程（六）数据收发的扩展用法

13 数据收发的扩展用法 xff08 上 xff09 问题 write 和 send 都可以发送数据 xff0c 有什么区别 xff1f read 和 recv 都可以接收数据 xff0c 有什么区别 xff1f 数据收发选项调用时fla

随机推荐

Linux调试私房菜（三）开发中的辅助工具

六开发中的辅助工具 1 什么是开发环境构建环境代码编写 xff0c 程序编译 xff0c 版本控制 xff08 可选 xff09 调试环境用于定位问题的辅助工具集测试环境用于验证目标程序是否满足用户的显性需求和隐性需求 2 嵌入式
Linux调试私房菜（九）设计，软件质量之本

十八设计 xff0c 软件质量之本 xff08 上 xff09 1 软件设计是什么 xff1f 一种创造性活动 xff0c 力求以简单优雅的方式解决实际问题软件设计是一门技术数据结构 xff0c 组成原理 xff0c 操作系统 xff
教你玩转makeflie（七）make 中的路径搜索、路径搜索的综合示例

第十七部分 xff1a make 中的路径搜索 xff08 上 xff09 17 1 问题在实际的工程项目中 xff0c 所有的源文件和头文件都放在同一个文件夹中吗 17 2 常用的源码管理方式项目中的makefile必须能够正确
数据结构实战开发教程（六）栈的概念及实现、队列的概念及实现、两个有趣的问题

三十四栈的概念及实现 xff08 上 xff09 1 栈的定义栈是一种特殊的线性表栈仅能在线性表的一端进行操作栈顶 Top xff1a 允许操作的一端栈底 Bottom xff1a 不允许操作的一端 2 栈的特性后进先出 La
数据结构实战开发教程（七）字符串类的创建、KMP 子串查找算法、KMP 算法的应用、递归的思想与应用

三十九字符串类的创建 xff08 上 xff09 1 历史遗留问题 C语言不支持真正意义上的字符串 C语言用字符数组和一组函数实现字符串操作C语言不支持自定义类型 xff0c 因此无法获得字符串类型从C到C 43 43 的进化过
数据结构实战开发教程（八）选择排序和插入排序、冒泡排序和希尔排序、归并排序和快速排序、排序的工程应用示例

四十六排序的基本概念 1 排序的一般定义排序是计算机内经常进行的一种操作 xff0c 其目的是将一组无序的数据元素调整为有序的数据元素 2 排序的数学定义 3 排序的示例 4 问题按总评排序后为什么张无忌的排名比郭靖靠前呢 x
【Golang】exec.Command 命令的使用(执行及获取结果)

span class token comment 5秒超时 span ctx span class token punctuation span cancelFunc span class token operator 61 span co
Jetbrains 全家桶配置

Intellij idea CLion Android Studio Pycharm 链接 xff1a https pan baidu com s 1V74a A2rZLnFWVNuVWLrCQ 提取码 xff1a 6666 一 xff1a
CentOS7 yum方式安装MySQL5.7

在CentOS中默认安装有MariaDB xff0c 这个是MySQL的分支 xff0c 但为了需要 xff0c 还是要在系统中安装MySQL xff0c 而且安装完成之后可以直接覆盖掉MariaDB 1 下载并安装MySQL官方的 Yum
Win11 Android Stuido虚拟机启动失败、崩溃

当我开启了虚拟机平台后会导致AndroidStudio虚拟机崩溃 xff0c 关闭此功能即可当时开启这个功能主要是为了使用Win11 安卓子系统具体原因不知道是什么导致的 xff0c 如有答案务必分享分享 xff01 xff01 xff
Kotlin Native Konan 默认依赖路径修改

记录一下 C User xxxx konan是kotlin native依赖下载的默认缓存路径 kotlin native 文件夹下的配置文件找到konan properties文件发现一段注释使用 KONAN DATA DIR 环境变
官方控件SwipeRefreshLayout内嵌套滑动控件会导致进度条指示器空白并保留

前言 xff1a 准备实现一个刷新获取数据的功能刷新的时候遇到了空白圈圈保留 xff0c 于是开始查看SwipeRefreshLayout的源码并想了好几种方式去修复 xff0c 最终采用反射 xff08 第一次使用反射可能用的很糟糕 x
NestedScrollView向上滚动一段距离

注 xff1a 记一次问题 xff08 花了三个小时 xff09 尝试给控件设置焦点没效果问题复现 AppBarLayout 43 NestedScrollView 并给NestedScrollView设置以下代码 xff09 lt a
day65 JavaWeb框架阶段——全文检索技术Lucene（非结构化数据查询方法，中文分析器IKAnalyzer）

1 今日内容什么是全文检索 xff0c 如何实现全文检索Lucene实现全文检索的流程 a 创建索引 b 查询索引配置开发环境入门程序分析器的分析过程 a 测试分析器的分词效果 b 第三方中文分析器索引库维护 a 添加文档 b 删除文档
【已解决】阿里云配置安全组后，仍无法访问端口问题

文章首发于如下链接 xff1a http 80sdianying xyz id 61 8 最近在搭python的falsk服务器 xff0c 遇到一个问题 xff0c 在服务器运行python程序后 xff0c 外网无法访问到该程序 xff
ubuntu 14.04 软件中心闪退解决方案

ubuntu 14 04 软件中心闪退解决方案参考文章 xff1a xff08 1 xff09 ubuntu 14 04 软件中心闪退解决方案 xff08 2 xff09 https www cnblogs com lvchaoshun
“No X11 DISPLAY variable was set”问题的解决过程

No X11 DISPLAY variable was set 问题的解决过程参考文章 xff1a xff08 1 xff09 No X11 DISPLAY variable was set 问题的解决过程 xff08 2 xff09 h
postgreSql查询复杂json数组字段

因为在生产环境中使用到两次故而记录一下对复杂json字段提取字段值的SQL 先看数据格式 xff1a 假设表名为 ry xff1b 下面的数据格式是我们的字段ryxx 34 bh 34 34 123 34 34 jbxx 34 34 xm
VS调用大恒相机sdk实时显示图像并进行图像处理+OPENCV

前言 xff1a 近期企业需要用大恒相机的sdk开发项目 xff0c 我采用VS2017 43 QT5 10 1 43 MSVC 一环境配置 VS2017和qt的安装不多介绍 xff0c 主要介绍大恒sdk的配置 1 https www
元学习每日学习之路

参考视频 2 21 元学习 xff1a 学会如何去学习 xff0c 就是带着这种对人类这种学习能力的期望诞生的 Meta Learning希望使得模型获取一种学会学习的能力 xff0c 使其可以在获取已有知识的基础上快速学习新的

元学习 每日学习之路

元学习 每日学习之路 的相关文章

随机推荐

热门标签

元学习每日学习之路

元学习每日学习之路的相关文章