计算机视觉:图像检测和图像分割有什么区别?

2023-11-09

人工智能中的图像处理

人工智能对于图像处理有不同的任务。在本文中,我将介绍目标检测和图像分割之间的区别。

在这两个任务中,我们都希望找到图像中某些感兴趣的项目的位置。例如,我们可以有一组安全摄像头照片,在每张照片上,我们想要识别照片中所有人的位置。

通常有两种方法可以用于此:目标检测(Object Detection)和图像分割(Image Segmentation)。

目标检测-预测包围盒

当我们说到物体检测时,我们通常会说到边界盒。这意味着我们的图像处理将在我们的图片中识别每个人周围的矩形。

边框通常由左上角的位置(2 个坐标)和宽度和高度(以像素为单位)定义。

来自开放图像数据集的注释图像。家庭堆雪人,来自 mwvchamber。在CC BY 2.0 许可下使用的图像。

如何理解目标检测方法?

如果我们回到任务:识别图片上的所有人,则可以理解通过边界框进行对象检测的逻辑。

我们首先想到的解决方案是将图像切成小块,然后在每个子图像上应用图像分类,以区别该图像是否是人类。 对单个图像进行分类是一项较容易的任务,并且是对象检测的一项,因此,他们采用了这种分步方法。

当前,YOLO模型(You Only Look Once)是解决此问题的伟大发明。 YOLO模型的开发人员已经构建了一个神经网络,该神经网络能够立即执行整个边界框方法!

当前用于目标检测的最佳模型

  • YOLO
  • Faster RCNN

图像分割-预测掩模

一步一步地扫描图像的逻辑替代方法是远离画框,而是逐像素地注释图像。

如果你这样做,你将会有一个更详细的模型,它基本上是输入图像的一个转换。

如何理解图像分割方法?

这个想法很基本:即使在扫描产品上的条形码时,也可以应用一种算法来转换输入信息(通过应用各种过滤器),这样,除了条形码序列以外的所有信息在最终图像中都不可见。


左图:https://commons.wikimedia.org/wiki/File:Image-segmentation-example.jpg。右图:https://commons.wikimedia.org/wiki/File:Image-segmentation-example-segmented.png。两个文件都支持 https://en.wikipedia.org/wiki/en:Creative_Commons

这是在图像上定位条形码的基本方法,但与在图像分割中所发生的情况类似。

图像分割的返回格式称为掩码:与原始图像大小相同的图像,但是对于每个像素,它只有一个布尔值来指示对象是否存在。

如果我们允许多个类别,它就会变得更加复杂:例如,它可以将一个海滩景观分为三类:空气、海洋和沙子。

当下图像分割的最佳模型

  • Mask RCNN
  • Unet
  • Segnet

比较总结

对象检测

  • 输入是一个矩阵(输入图像),每个像素有 3 个值(红、绿、蓝),如果是黑色和白色,则每个像素有 1 个值
  • 输出是由左上角和大小定义的边框列表

图像分割

  • 输入是一个矩阵(输入图像),每个像素有 3 个值(红、绿、蓝),如果是黑色和白色,则每个像素有 1 个值
  • 输出是一个矩阵(掩模图像),每个像素有一个包含指定类别的值
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

计算机视觉:图像检测和图像分割有什么区别? 的相关文章

随机推荐

  • Java设计模式——装饰者模式

    装饰者模式 一 概述 装饰者模式 装饰器模式 是一种结构型模式 定义 在不改变现有对象结构的情况下 动态地给该对象增加一些额外职责 功能 的模式 装饰者 Decorator 模式中的角色 抽象构件 Component 角色 定义一个抽象接口
  • 7-44 求整数的位数及各位数字之和

    对于给定的正整数N 求它的位数及其各位数字之和 输入格式 输入在一行中给出一个不超过109的正整数N 输出格式 在一行中输出N的位数及其各位数字之和 中间用一个空格隔开 输入样例 321 输出样例 3 6 include
  • Tomcat流程图分析

    org apache catalina startup Bootstrap 启动类 初始化步骤 从server开始到service connector 后实现了lifecycle 接口 bootstrape init gt catelina
  • Protobuf下载和编译

    系列导航 一 Protobuf下载和编译 二 Protobuf在Java中的简单使用 一 简介 protobuf全称Google Protocol Buffers 是google开发的的一套用于数据存储 网络通信时用于协议编解码的工具库 是
  • C#中导出百万级Excel只需几秒除了NPOI还可以这样

    场景 Winform中通过NPOI导出Excel的三种方式 HSSFWorkbook XSSFWorkbook SXSSFWorkbook 附代码下载 https blog csdn net BADAO LIUMANG QIZHI arti
  • 剪格子 蓝桥杯 211

    题目描述 如下图所示 3 x 3 的格子中填写了一些整数 我们沿着图中的红色线剪开 得到两个部分 每个部分的数字和都是 60 本题的要求就是请你编程判定 对给定的 m n 的格子中的整数 是否可以分割为两个部分 使得这两个区域的数字和相等
  • com.alibaba.fastjson.JSONArray cannot be cast to com.alibaba.fastjson.JSONObject

    json中类型转换问题 是错误的格式 例 JSONObject parseObject type slider show true start 1 end 100 正确的写法 JSONObject dataZoom new JSONObje
  • C# 委托(delegate)

    1 什么是委托 委托是一种引用类型 它是函数指针的托管版本 在C 中 委托是一种可以把引用存储为函数的类型 委托可以引用实例和静态方法 而函数指针只能引用静态方法 委托的声明非常类似于函数 和函数不同的的是委托不带函数体 并且需要Deleg
  • 初识Spring Boot

    目录 一 Spring Boot是什么 二 创建Spring Boot项目 1 使用IDEA创建 2 网页版创建 三 运行项目 一 Spring Boot是什么 简单来说Spring Boot就是Spring的 脚手架 就是一个框架 Spr
  • nodejs libuv学习

    读了一下libuv源代码 简单记录一些见解 https github com libuv libuv libev就是一个基于epoll封装事件的函数库 自身不带有线程池等操作 而libuv则是在libev基础上 加上线程操作的功能 大体运作
  • Java中Array.sort()的几种用法

    转载https www tuicool com articles iii6N3 Java的Arrays类中有一个sort 方法 该方法是Arrays类的静态方法 在需要对数组进行排序时 非常的好用 但是sort 的参数有好几种 下面我就为大
  • 【QT控件大小自适应窗口变化】

    问题 刚开始学习QT时 在窗口中放置一个个控件 而后运行程序 会发现改变窗口大小时 控件大小不随窗口大小变化而变化 导致窗口大小变化没意义 同时也让精心布局看起来很难看 本文提供一种使用BoxLayout中放置控件 所有可见控件能够随窗口大
  • 同仁堂-十大王牌、十大名药

    同仁堂 十大王牌 十大名药 官网 ZY123 com 中医123
  • WPS中编辑Word删除内容之后保存退出了如何恢复?

    目录 一 问题简述 二 Word用户 场景一 情况一 删除了内容没有退出文档 情况二 删除了内容退出文档 情况三 删除了文件退出文档 三 Wps用户 场景二 情况一 删除了内容没有退出文档 情况二 删除了内容退出文档 情况三 删除了文件退出
  • PAT 5 剪邮票

    剪邮票 如 图1 jpg 有12张连在一起的12生肖的邮票 现在你要从中剪下5张来 要求必须是连着的 仅仅连接一个角不算相连 比如 图2 jpg 图3 jpg 中 粉红色所示部分就是合格的剪取 请你计算 一共有多少种不同的剪取方法 请填写表
  • Flink从入门到真香(18、使用flink table api 从文件和kafka中读取数据)

    还是一样 要先引入依赖 在pom xml
  • java 数组排序(冒泡排序、快速排序、简单排序)

    目录 1 冒泡排序 2 快速排序 3 简单排序 1 冒泡排序 简介 1 循环遍历数组 判断相邻两个元素大小如果满足条件list x gt list x 1 则将两个元素位置对换 2 重复步骤 1 判断初始元素向右依次递减 3 一般有两层循环
  • win10桌面计算机不显示桌面,win10桌面不见了,win10桌面显示不了任何程序

    解决方法 首先 由于图标缓存文件是隐藏文件 我们需要在资源管理器中将zd设置改为 显示所有文件 操作方法 1 随便打开一个文件夹 2 点击 查看 菜单 然后勾选 隐藏的项目 同时按下快捷键 Win R 在打开的运行窗口中输版入 locala
  • 怎么分析用户活跃、指标波动

    相关文章 用户画像 3种标签类型 8大系统模块 知道用户画像标签有哪些维度 应用场景体系 是种什么样的体验 用户运营 用户分析 店铺数据分析 小程序数据分析 思维导图 数据分析全知识 思维导图 Xmind思维导图 常用快捷键使用 参考作者
  • 计算机视觉:图像检测和图像分割有什么区别?

    人工智能中的图像处理 人工智能对于图像处理有不同的任务 在本文中 我将介绍目标检测和图像分割之间的区别 在这两个任务中 我们都希望找到图像中某些感兴趣的项目的位置 例如 我们可以有一组安全摄像头照片 在每张照片上 我们想要识别照片中所有人的