loss-FSCE 小样本识别

2023-11-11

FSCE: Few-Shot Object Detection via Contrastive Proposal Encoding
以Faster RCNN 作为小样本目标检测的基本框架，采用两阶段的训练方法——第一阶段的训练集是大量标注的基本类别数据，第二阶段采用少量的基础类别和新类别进行微调。在 Faster RCNN 的 RoI feature extractor 后除了回归和分类损失，还添加了一个建议框对比编码（CPE）损失。
在这里插入图片描述

参考链接：
https://blog.csdn.net/qq_38701106/article/details/121151422

https://blog.csdn.net/qq_38701106/article/details/121151422?spm=1001.2101.3001.6661.1&utm_medium=distribute.pc_relevant_t0.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-1.no_search_link&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-1.no_search_link

contrastive predictive coding ------------ CPC领域

在两阶段检测框架中，RPN将骨干特征映射作为输入并生成区域建议框，然后RoI head对每个区域建议框进行分类，如果预测包含对象，则对边界框进行回归。

Roi cls是进行分类，输出概率值；
该篇文章使用对比分支来增强感兴趣区域（RoI）的头部，对比分支度量目标提议编码之间的相似性。
即，contrastive head 进行特征处理之后：：在MLP头部编码的RoI特征上，测量目标建议框表示之间的相似性分数。 并优化对比目标， 以最大化来自同一类别的目标建议框之间的一致性，并提高来自不同类别建议框的区别性。

将优化具有特定检测考虑的监督对比目标，以减少来自同一类别的目标建议框提取特征的差异，同时使不同类别实例彼此远离。

在这里插入图片描述
上图中，N个mini-batch, N个proposal;

p下标：∈ [0, n] ；y下标：∈ [0, m] ；
在loss中，特征z与标签y的下标一致；

在进行CPE LOSS之前，针对提取的特征Pi，已经进行了label的预测---------------bbox与cls的Loss ;

Contrastive Proposal Encoding (CPE) Loss
在这里插入图片描述
f(·)controls the consistency of proposals;
g(·) assigns different weight coefficients for object proposals with different level of IoU scores.

u----IOU score ::::
预测x, y, w, h之后，bbox与真实框进行了对比，然后使用f(·)进行框的阈值的筛选，排除不必要信息；去掉低阈值的框之后，进行预测框（同类别）之间的对比；
~~还是指，对比损失里的真实框，其实都是预测框之间的比较，非预测框与真实标签之间的对比；~~
在这里插入图片描述
N个 ---- {z, u, y}

z----feature

y----label of GT
在这里插入图片描述
Nyi----是有几个yi

公式3----假设 i=3时，N个特征中，除却3，进行与其他N-1个特征的相似度计算； 分母不变，相似度越高，分子越大，loss越小；相似度低，loss越大；

	红框公式约束label；约束 标签相同？
    同类别（根据label判断）的特征向量之间的相似度；
    分母: 计算一个batch中所有特征向量之间的相似度之和；

目标是让同类特征向量之间的相似度为1，不同类特征向量之间的相似度为0

公式类似于交叉熵与softmax ;

交叉熵：
在这里插入图片描述
对于正样本而言，输出概率越大损失越小。[下图红线，[0, 1] ---- 区间 ]

对于负样本而言，输出概率越小则损失越小。
在这里插入图片描述

Softmax:
在这里插入图片描述
--------------------分割线------
reid–度量学习中：对比损失（Contrastive loss ）；其实都是为了匹配相似性；

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

loss-FSCE 小样本识别的相关文章

MIT_线性代数笔记：第 23 讲微分方程和 exp(At)

目录微分方程 Differential equations 矩阵指数函数 Matrix exponential e A t e At
Python机器学习实战：用Python构建10个有趣的应用

机器学习是一门强大的工具可以用于解决各种各样的问题通过学习机器学习您可以开发出能够自动化任务做出预测甚至创造艺术的应用程序如果您是一名 Python 开发人员那么您将很高兴知道有许多可以用 Python 构建的有趣机器学习应用
友思特分享 | CamSim相机模拟器：极大加速图像处理开发与验证过程

来源友思特机器视觉与光电友思特分享 CamSim相机模拟器极大加速图像处理开发与验证过程原文链接 https mp weixin qq com s IED7Y6R8WE4HmnTiRY8lvg 欢迎关注虹科为您提供最新资讯随着
使用pytorch构建图卷积网络预测化学分子性质

在本文中我们将通过化学的视角探索图卷积网络我们将尝试将网络的特征与自然科学中的传统模型进行比较并思考为什么它的工作效果要比传统的方法好图和图神经网络化学或物理中的模型通常是一个连续函数例如y f x x x x 其中x x x
lr推荐模型特征重要性分析

在分析lr模型特征重要性之前需要先明白lr模型是怎么回事儿 lr模型公式是sigmoid w1 x1 w2 x2 wn xn 其中w1 w2 wn就是模型参数 x1 x2 xn是输入的特征值对于lr模型来说特征可以分为两个粒度一个是
图像分割-Grabcut法(C#)

版权声明本文为博主原创文章转载请在显著位置标明本文出处以及作者网名未经作者允许不得用于商业目的本文的VB版本请访问图像分割 Grabcut法 CSDN博客 GrabCut是一种基于图像分割的技术它可以用于将图像中的前景和背景分离
图像分割-Grabcut法

版权声明本文为博主原创文章转载请在显著位置标明本文出处以及作者网名未经作者允许不得用于商业目的本文的C 版本请访问图像分割 Grabcut法 C CSDN博客 GrabCut是一种基于图像分割的技术它可以用于将图像中的前景和背景
时间序列平稳性相关检验方法

理解平稳性一般来说平稳时间序列是指随着时间的推移具有相当稳定的统计特性的时间序列特别是在均值和方差方面平稳性可能是一个比较模糊的概念将序列排除为不平稳可能比说序列是平稳的更容易通常不平稳序列有几个特征平均值随时间推移发生变化
山西电力市场日前价格预测【2024-01-05】

日前价格预测预测说明如上图所示预测明日 2024 01 05 山西电力市场全天平均日前电价为259 10元 MWh 其中最高日前电价为363 99元 MWh 预计出现在18 00 最低日前电价为0 00元 MWh 预计出现在11 1
《Aspect Sentiment Quad Prediction as Paraphrase Generation》论文阅读

文章目录文章介绍文章模型问题定义文章模型 PARAPHRASE建模文章地址 https arxiv org abs 2110 00796 文章介绍
图神经网络与智能化创作艺术：开启艺术的智能时代

导言图神经网络 GNNs 与智能化创作艺术的结合为艺术领域带来了新的可能性本文深入研究二者的结合方向包括各自的侧重点当前研究动态技术运用实际场景未来展望并提供相关链接 1 图神经网络与智能化创作艺术的结合方向 1 1 图神经
请求各位大佬帮助，请问qt项目能调用卷积神经网络进行训练模型嘛？

qt项目想调MobileNetV3网络进行训练模型得到权重文件能实现嘛
如何解决Mybatis-plus与Mybatis不兼容的问题：An attempt was made to call a method that does not exist. The attempt

博主猫头虎的技术世界欢迎来到猫头虎的博客探索技术的无限可能专栏链接精选专栏面试题大全面试准备的宝典 IDEA开发秘籍提升你的IDEA技能 100天精通Golang Go语言学习之旅领域矩阵猫头虎技术领域矩阵深入探索各技
深度好文：最全的大模型 RAG 技术概览

本文是对检索增强生成 Retrieval Augmented Generation RAG 技术和算法的全面研究对各种方法进行了系统性的梳理涉及了 RAG 流程中的数据拆分向量化查询重写查询路由等等在做 RAG 的小伙伴一定知道
用通俗易懂的方式讲解：图解 Transformer 架构

文章目录用通俗易懂方式讲解系列 1 导语 2 正文开始现在我们开始编码从宏观视角看自注意力机制从微观视角看自注意力机制通过矩阵运算实现自注意力机制
【图像融合】基于联合双边滤波和局部梯度能量的多模态医学图像融合研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码图像文章
基于opencv的大米计数统计（详细处理流程＋代码）

在我每周的标准作业清单中有一项是编写计算机视觉算法来计算该图像中米粒的数量因此当我的一个好朋友M给我发了一张纸上的扁豆照片显然是受到上述转发的启发请我帮他数一下谷物的数量时它勾起了我怀旧的回忆因此我在我的旧硬盘上寻找很久以前
2024 人工智能与大数据专业毕业设计(论文)选题指导

目录前言毕设选题选题迷茫选题的重要性更多选题指导最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生
用通俗易懂的方式讲解：使用 LlamaIndex 和 Eleasticsearch 进行大模型 RAG 检索增强生成

检索增强生成 Retrieval Augmented Generation RAG 是一种结合了检索 Retrieval 和生成 Generation 的技术它有效地解决了大语言模型 LLM 的一些问题比如幻觉知识限制等随着 RAG
AI在广告中的应用——预测性定位和调整

营销人员的工作就是在恰当的时间将适合的产品呈现在消费者面前从而增加他们购买的可能性随着时间的推移营销人员能够深入挖掘越来越精准的客户细分市场他们不仅具备了实现上述目标的能力而且这种能力还在呈指数级提升在AI技术帮助下现在的营销

随机推荐

灰灰-324-2019华科软院学硕上机（二）-魔方阵:vector、resize()、setw()

魔方阵古代又称纵横图是指组成元素为自然数1 2 n的平方的n n的方阵其中每个元素值都不相等且每行每列以及主副对角线上各n个元素之和都相等阶数大于等于3 如3 3的魔方阵 8 1 6 3 5 7 4 9 2 奇数魔方阵的排列
ARDUINO使用GPRS发送GPS数据到OneNet测试

功能测试把固定的GPS数据发送到OneNet平台调试途中碰到的问题 ARDUINO不支持sprintf的double打印只能转换为char字符串然后再 s打印 include
永磁同步电机（PMSM）磁场定向控制（FOC）电流环PI调节器参数整定

文章目录前言一调节器的工程设计方法二电流环PI调节器的参数整定 2 1 电流环的结构框图 2 2 典型I型系统 2 3 电流环PI参数整定计算公式三电流环PI调节器设计实例 3 1 永磁同步电机磁场定向的电流闭环控制 3 2
关于qt 读写结构体

目录前言一注意事项 1 1 需求 1 2 读文件报错 1 2 1 文件写入 1 2 2 文件读取 1 2 3 文件写入 1 2 4 文件读取二解决方案 2 1 正确实例代码 2 1 1 头文件 2 1 2 源文件 2 1 3 文件
响应式布局的常用解决方案对比(媒体查询、百分比、rem和vw/vh）

简要介绍前端开发中静态网页通常需要适应不同分辨率的设备常用的自适应解决方案包括媒体查询百分比 rem和vw vh等本文从px单位出发分析了px在移动端布局中的不足接着介绍了几种不同的自适应解决方案本文原文在我的github主
【粉丝问答9】一起入职的同事能力不如我，只因学历比我高，工资是我的两倍

一起入职的同事能力不如我只因学历比我高工资是我的两倍我想这是很多初入职场的同学经常会遇到的一个问题本篇只针对研发人员一口君有个朋友C君刚毕业的第一家也遇到过类似的问题 C君是本科进入做路由器的协议开发工作辛辛苦苦开发的软件模块
Linux Sed命令详解

概述 sed是stream editor的简称也就是流编辑器它一次处理一行内容处理时把当前处理的行存储在临时缓冲区中称为 pattern space 接着用sed命令处理缓冲区中的内容处理完成后把缓冲区的内容送往屏幕接着处理
KITTI数据集解析

KITTI 数据集解析本文主要是对于3D目标检测中 KITTI数据集的分析数据下载 KITTI 官网链接下载的主要有 left color images velodyne point clouds camera calibration
云备份项目

云备份项目 1 云备份认识自动将本地计算机上指定文件夹中需要备份的文件上传备份到服务器中并且能够随时通过浏览器进行查看并且下载其中下载过程支持断点续传功能而服务器也会对上传文件进行热点管理将非热点文件进行压缩存储节省磁盘空间 2
数据结构--回顾数据结构基本概念、数据结构三要素

目录什么是数据数据元素什么是数据对象什么是数据结构数据结构的三要素逻辑结构 1 集合 2 线性结构编辑 3 树形结构 4 图结构数据的运算物理结构也叫做存储结构 1 顺序存储 2 链式存储 3 索引存储借助索引表 4
CMOS芯片制造全工艺流程（后端基础第一篇）

芯片制造全工艺流程详情我们每天运行程序的芯片是这样造出来的放大后的芯片机构无与伦比的美在如此微观世界人类科技之巅芯片一般是指集成电路的载体也是集成电路经过设计制造封装测试后的结果通常是一个可以立即使用的独立的整体如果
Windows7下安装docker记录

docker火了也那么好几年了偶才开始学习docker 说来真是落后主潮流太久不过落后有落后的好处因为大多数的坑都已经有人填过所以遇见问题解决问题那也是相当的迅速但就算是相当的迅速这windows7下安装docker 也花了我大
java 算数

public class Arith 提供精确加法计算的add方法 param value1 被加数 param value2 加数 return 两个参数的和 public static double add double value1
Spring cloud系列十五使用线程池优化feign的http请求组件

1 概述在默认情况下 spring cloud feign在进行各个子服务之间的调用时 http组件使用的是jdk的HttpURLConnection 没有使用线程池本文先从源码分析feign的http组件对象生成的过程然后通过为fe
深入理解web安全攻防策略

前言互联网时代数据安全与个人隐私信息等受到极大的威胁和挑战本文将以几种常见的攻击以及防御方法展开分析 1 XSS 跨站脚本攻击定义通过存在安全漏洞的Web网站注册用户的浏览器内运行非法的HTML标签或JavaScript进行的一种
VS视图菜单中找不到服务器资源管理器怎么办？

http www cnblogs com SissyNong archive 2011 06 18 1981970 html 前几天同事安装了VS2010后发现视图菜单中根本就没有服务器管理器这一项如果想打开服务器管理器都要使用快捷键
区块链共识算法的发展现状与展望

区块链共识算法的发展现状与展望袁勇等 1 传统分布式一致性算法 2 主流区块链共识算法 3 共识算法的模型与分类 4 区块链共识算法的新进展 4 1 主线 1 PoW 与 PoS 算法的有机结合 4 2 主线 2 原生 PoS 算法的改进
翻转数组

题目描述给定一个长度为n的整数数组a 元素均不相同问数组是否存在这样一个片段只将该片段翻转就可以使整个数组升序排列其中数组片段 l r 表示序列a l a l 1 a r 原始数组为 a 1 a 2 a l 2 a l 1 a l
数据挖掘顶级比赛---综合整理

整理所有可以参加的数据挖掘顶级比赛 1 DrivenData https www drivendata org 2 CrowdANALYTIX https www crowdanalytix com solutions community
loss-FSCE 小样本识别

FSCE Few Shot Object Detection via Contrastive Proposal Encoding 以Faster RCNN 作为小样本目标检测的基本框架采用两阶段的训练方法第一阶段的训练集是大量标注的基本

loss-FSCE 小样本识别

loss-FSCE 小样本识别 的相关文章

随机推荐

热门标签

loss-FSCE 小样本识别的相关文章