分类、目标检测、语义分割、实例分割的区别

2023-11-10

计算机视觉的任务很多,有图像分类、目标检测、语义分割、实例分割和全景分割等,那它们的区别是什么呢?

1、Image Classification(图像分类)

图像分类(下图左)就是对图像判断出所属的分类,比如在学习分类中数据集有人(person)、羊(sheep)、狗(dog)和猫(cat)四种,图像分类要求给定一个图片输出图片里含有哪些分类,比如下图的例子是含有person、sheep和dog三种。

在这里插入图片描述

2、Object detection(目标检测)

目标检测(上图右)简单来说就是图片里面有什么?分别在哪里?(把它们用矩形框框住)

目前常用的目标检测算法有Faster R-CNN和基于YOLO的目标检测的算法

3、semantic segmentation(语义分割)

通常意义上的目标分割指的就是语义分割

语义分割(下图左)就是需要区分到图中每一点像素点,而不仅仅是矩形框框住了。但是同一物体的不同实例不需要单独分割出来。对下图左,标注为人,羊,狗,草地。而不需要羊1,羊2,羊3,羊4,羊5等。
在这里插入图片描述

4、Instance segmentation(实例分割)

实例分割(上图右)其实就是**目标检测和语义分割**的结合。相对目标检测的边界框,实例分割可精确到物体的边缘;相对语义分割,实例分割需要标注出图上同一物体的不同个体(羊1,羊2,羊3…)

目前常用的实例分割算法是Mask R-CNN

Mask R-CNN 通过向 Faster R-CNN 添加一个分支来进行像素级分割,该分支输出一个二进制掩码,该掩码表示给定像素是否为目标对象的一部分:该分支是基于卷积神经网络特征映射的全卷积网络。将给定的卷积神经网络特征映射作为输入,输出为一个矩阵,其中像素属于该对象的所有位置用 1 表示,其他位置则用 0 表示,这就是二进制掩码。

一旦生成这些掩码, Mask R-CNN 将 RoIAlign 与来自 Faster R-CNN 的分类和边界框相结合,以便进行精确的分割:

5、Panoramic segmentation(全景分割)

全景分割语义分割实例分割的结合。跟实例分割不同的是:实例分割只对图像中的object进行检测,并对检测到的object进行分割,而全景分割是对图中的所有物体包括背景都要进行检测和分割。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

分类、目标检测、语义分割、实例分割的区别 的相关文章

  • threejs视图切换方法

    1 获取观察物体group的中心位置 group可以是stl glb group对象等 2 设置相机位置和朝向 从而达到切换视图的目的 正视图 camera position设置为 x y z 150 camera up x 0 camer
  • java.util.concurrent.Future 使用指南

    1 介绍 本篇文章将了解 Future 一个自 Java 1 5 以来就存在的接口 它在处理异步调用和并发处理时非常有用 2 创建Futures 简单地说 Future 类表示异步计算的未来结果 这个结果最终会在处理完成后出现在 Futur
  • 学人工智能以后从事什么工作?这6大就业方向前景广阔

    学AI以后从事什么工作 近些年来 科技的快速发展 使人工智能方面的人才炙手可热 根据此前UiPath发布的数据显示 我国AI岗位空缺数量最多 有12113个相关职位因为招聘不到人才而发生空缺 我国对于AI人才的渴求已经超过了人工智能大国美国
  • 【TCP/IP】第三章 数据链路

    数据链路的作用 数据链路相关技术 MAC地址用于识别数据链路中互连的节点 MAC地址长48bit 一般来说全球MAC地址为一不会重复 地址结构组成 从通信介质的使用方法上看 网咯可以分为共享介质型和非共享介质型 共享介质方式指的是多个设备共
  • Declaration of 'struct sockaddr_in' will not be visible outside of this function警告的处理

    Declaration of struct sockaddr in will not be visible outside of this function 做ios网络开发的肯定会用到苹果的官方库Reachability ios5发布了
  • 单片机-4x4个矩阵按键控制数码管显示数字程序

    1 include 8051 h 2 typedef unsigned char u8 3 typedef unsigned int u16 4 u8 smgduan 5 0 1 2 3 4 5 6 7 6 0x3f 0x06 0x5b 0
  • Redis常用的命令String,list,hash,set,zset

    常用的指令 redis Key关键字 keys 查看本库中的所有的key exists key的名字 判断某个key是否存在 move key db 当前的库中的key就没有了 被移除了 expire key 秒钟 给指定的key设置过期的

随机推荐

  • npm设置和取消代理的方法

    设置代理 npm config set proxy http 127 0 0 1 8087 npm config set registry http registry npmjs org 关于https 经过上面设置使用了http开头的源
  • 51单片机的数字时钟系统【含仿真+程序+报告+原理图】

    1 主要功能 该系统由AT89C51单片机 DS1302时钟模块 按键模块 LCD显示模块构成 利用51单片机实现电子时钟的功能 使用DS1302芯片作为计时设备 用LCD1602作为显示设备 按键按下可修改当前时间 按下的时候蜂鸣器会di
  • dao层代码

    dao层 数据接口层 方法层 介于业务逻辑层和数据库之间 进行数据的访问和操作 在实际业务处理过程中 往往需要进行多次数据库的访问 这些访问性质往往是相同的 采用Dao层可以将对数据库访问进行封装 避免经行重复性数据库访问开发操作 同时降低
  • 数据挖掘-为什么进行数据挖掘

    为什么进行数据挖掘 1 进入信息时代 信息时代数据量暴增 社会计算机化和功能强大的数据收集和存储工具导致数据的爆炸式增长 数据的爆炸式增长 广泛可用和巨大数量使得当前时代成为真正的数据时代 急需功能强大和通用的工具 以便从这些海量数据中发现
  • matlab运动背景位移矢量,[Matlab科学绘图] 绘制平面位移云图

    Matlab科学绘图 绘制平面位移云图 Matlab科学绘图 绘制平面位移云图 在用MATLAB做有限元分析的时候 难免需要绘制云图 网上的资料又很少 且不通用 自己实现之后在此记录一下 希望也能帮助到其他人 平台 Win7 Matlab
  • 《雷达系统设计MATLAB仿真》学习

    文章目录 第一章 雷达分类 按频段分类 按波形分类 按用途分类 监视雷达 跟踪雷达 第四章 模糊函数 模糊函数的几点应用 目标分辨情况 测量精度 模糊情况 杂波抑制能力 输出功率波形 第六章 杂波 擦地角 掠射角 下俯角 入射角 海杂波 地
  • 上拉和下拉电阻 [附:OC门与OD门]

    上拉就是通过一个电阻将芯片的一个引脚或线路中的一点接电源正极 Vcc 将该处电平拉向高电平 下拉就是通过一个电阻将芯片的引脚或线路中的一点接地 将该处电平拉向低电平 其主要目的是在电路驱动器关闭时给引脚或线路节点一个固定的默认的电平 上拉电
  • IOS开发笔记 - 调试技巧之自定义宏输出

    这个小技巧是在翻阅别人的代码时候发现的 由于以前学过C 所以知道这里应该是一个神奇的宏把 按alt点进去果然是酱紫 这里是当再DEBUG模式下 调用这个LogMethod的宏时会输出所在方法的方法名及所在行数 运行如下 有了这个宏 调试是不
  • vue中实现在子组件中刷新父组件

    一 首先是父组件 现在父组件中的子组件属性上添加监听事件 signStatusVerdict 二 其次是子组件 发射一个事件给父组件的监听属性 三 最后是父组件 父组件中监听到事件后会执行listenSignStatus方法 执行更新父组件
  • 【数字IC设计】亚稳态与多时钟切换

    数字IC设计 亚稳态与多时钟切换 1 亚稳态的产生与传输 1 1 CMOS反相器的电平传输特性曲线 2 亚稳态的恢复时间与平均无故障时间 3 减小亚稳态的建议 4 多时钟切换电路 本次是与触发器有关的亚稳态以及多时钟系统中的时钟切换问题讲解
  • 【论文】 各高校的毕业论文的Latex模板链接

    title 南京航空航天大学毕业论文 LaTeX 模板 postname date 2018 12 27 23 41 url http www latexstudio net archives 51558 html source 原始链接
  • 文献管理软件Mendeley的优缺点以及下载安装

    文献管理软件Mendeley Mendeley的简介 优点 缺点 Mendeley下载安装 Mendeley的简介 许多科研人员都知道 目前主流的文献管理软件老大哥是Endnote 但是如果你的学校或者科研机构没有购买这个软件的话 你是用不
  • mmocr dataset训练集可视化

    1 可视化效果 这里以dbnet网络训练 icdar2015数据集为例 from mmcv import Config imdenormalize from mmocr datasets import build dataset if na
  • 【python数据挖掘课程】二十五.Matplotlib绘制带主题及聚类类标的散点图

    这是 Python数据挖掘课程 系列文章 希望对您有所 帮助 当我们做聚类分析绘制散点图时 通常会遇到无法区分散点类标的情况 做主题分析时 可能会遇到无法将对应散点的名称 尤其中文名称 添加至图型中 为了解决这两个问题 本文提出了Matpl
  • PowerBI基础——第一天 度量值、新建列及关系函数 多对一及一对多匹配

    简体中文版的PowerBI官网 https powerbi microsoft com zh cn 在Analysis Services Power BI 以及 Excel 中的 Power Pivot中使用的公式表达语言叫做数据分析表达式
  • Fiddler过滤器 Filters 详解

    目录 前言 一 Hosts 过滤 较常用 二 Client Process 过滤 客户端进程过滤 通过配置只过滤 不过滤哪些进程的请求 用的不多 三 Request Headers 根据请求头信息进行过滤 常用 四 Breakpionts
  • 查看磁盘io

    yum y install sysstat 执行 iostat x 1 10 一般 util大于70 I O压力就开始出现了 如果 util越接近100 表明I O压力越大 rrqm s 每秒进行merge的读操作数目 即delta rme
  • element中手动图片上传,附带完整代码

    先展示一张图片效果图片 这种上传时 很常见的 之所以写这篇文章的目的时记录一下 和之前完全不同的上传方式 之前的上传方式 由于
  • 2023华为OD机试Java【报数问题】

    题目 最开始的时候 有100个同学 每个同学都有一个编号 从一到一百 所有的人围城一圈 报数的规则是 从 1 开始报数 如果某个报数为 M 那么他就退出游戏 他的下一个人从 1 重新开始报数 如果最后的人数小于M 则停止游戏 请你计算最后剩
  • 分类、目标检测、语义分割、实例分割的区别

    计算机视觉的任务很多 有图像分类 目标检测 语义分割 实例分割和全景分割等 那它们的区别是什么呢 1 Image Classification 图像分类 图像分类 下图左 就是对图像判断出所属的分类 比如在学习分类中数据集有人 person