矩形目标检测

2023-05-16

身份证、名片、书籍、 考试试卷、答题卡这些检测目标都属于矩形目标检测。

一,现有技术
 传统检测方法思路:
  第一步,采用滑动窗口,设置不同的大小,遍历图像,得到一些目标的候选框;
  第二步,候选框的图像特征提取;
  第三步,对候选框提取的特征进行分类器判断;
  第四步,对判断为目标的候选框进行处理得到最终的目标边框。
基于深度学习的目标检测:
候选区域+深度学习的方法,如 R-CNN,Fast R-CNN, Faster R-CNN 等方法;
基于深度学习的回归方法,如 YOLO、SSD 等方法。最后得到目标的边框和类别。
二,现有技术存在的问题
将目标检测模块部署在移动端,目标检测必须具备实效性。
传统算法中,基于滑动窗口的区域选择没有针对性,窗口冗余多,时间复杂度高,
另外手工设计的特征对于多样性的变换没有很好的鲁棒性。
深度学习方法中,移动端轻量级网络结构往往达不到高精度。VGG 等网络结构虽
然能达到高精度,但部署到移动端很难达到实时性。
三,本文方法介绍
 
     从图像中定位矩形目标的边框,有两方面:定位及评估准确性;
     
     技术思路:利用目标的边缘与线段,借助 ransac 思想,使用满足条件的多条线段去估计一个凸四边形,用 4 条线段或者 3 条线段,就能 估计出符合期望的凸四边形。因此,ransac 过程中,先后使用 4 条线段、3 条线段去估 计凸四边形,如果成功,就得到矩形目标的边框。 
    本方法检测透视变换程度较小的矩形目标。目标呈现在图像上,是一个不 规则凸四边形,检测到的线段构成的凸四边形越接近矩形越好。
   
    3D 世界坐标系转换到 2D 图像像素坐标系:

       其中 K 是摄像机内参,R,t 为世界坐标系到摄像机坐标系的旋转、平移变换。目标是一
个平面时,例如如文本平面,这里假定此平面是世界坐标系下的 Z=0 平面,则目标上的点
对应的上述变换就变成了:
     

其中 P 是 3x3 可逆矩阵,涵盖了摄像机内外参数,那么透视变换过程就是:

其中 P 是透视变换矩阵,可以基于对应的两个二维点集估计出来。
如果想要得到摄像机位置 1 到位置 2 的 x,y,z 三个方向的旋转角度,这需要估计 P,是一
个摄像机姿态估计问题。
因此,3D 空间中的矩形目标,变换后到图像上一个不规则凸四边形,这个凸四边形与
原矩形约接近越好。

四,流程

第 1 步,计算图像的边缘
可以使用传统的边缘检测方法,如 canny 边缘。
也可以使用轻量级的网络,检测边缘。精度不要求太高,移动端达到实时性就好。如
基于 mobilenet 训练的 HED 方法。
第 2 步,线段检测
利用基于概率的霍夫变换直线检测在边缘图上检测线段。
第 3 步,对线段进行合并,得到新线段集,见附录[9][10][11]
设定两直线距离阈值 e1、两直线弧度阈值 e2,两条线段的直线距离、弧度差若达到阈
值以内,则合并两线段为一条新线段。这样,遍历所有线段后,得到一组新的线段集。
第 4 步,遍历新线段集,抽取 4 条线段估计凸四边形。
如果估计成功,则输出凸四边形,作为边框定位结果;
如果估计不成功,进入第 5 步。
第 5 步,遍历新线段集,抽取 3 条线段估计凸四边形。
如果估计成功,则输出凸四边形,作为边框定位结果;
如果估计不成功,则失败。
五,效果
 
手持、弯折

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

矩形目标检测 的相关文章

随机推荐

  • 亚马逊,一个沉睡广告巨人的苏醒(虎嗅网)

    虽然拥有令无数广告主羡慕的高质量用户数据和巨大的网站流量 xff0c 但是在很长的一段时间内亚马逊还是将主要的精力集中在商品销售上 xff0c 广告只是作为自身业务的补充可有可无的存在 不过最近两年 xff0c 亚马逊对广告这种不屑的态度正
  • 大数据案例分析:电信业Hadoop应用分析 原文出自【比特网】,转载请保留原文链接:http://do.chinabyte.com/228/12410228.shtml

    电信业Hadoop应用分析 昨日 xff0c 联通研究院处长王志军在第七届 开源中国 开源世界 高峰论坛上分享了Hadoop在电信行业大数据应用的经验 随着国内3G网络的发展 xff0c 或者移动通信网络的发展 xff0c 中国联通 600
  • Vue富文本编辑器Tinymce内容导出Pdf、Word

    一 Tinymce导出Pdf 使用VueHtml2pdf插件 xff0c 安装插件 xff0c VueHtml2pdf详情见vue html2pdf npm npm i VueHtml2pdf 引入和注册 引入 import VueHtml
  • 大腕出手看门道,谈BAT的投资战略差异 三家战略投资的思考原点并不相同虎嗅网)

    中国互联网的收购之战 xff0c 比娱乐圈的明星离婚更一波三折和猜不透结局 当所有人以为搜狗被360牵回山寨只是早晚的事的时候 xff0c 搜狗和腾讯宣布好上了 眼瞅着今年第三季度即将结束 xff0c 中国互联网巨头们在2013年的 军备竞
  • JDK6的安装

    http www java net download jdk6 6u10 promoted b32 binaries jdk 6u10 rc2 bin b32 windows i586 p 12 sep 2008 exe XP 下 JDK6
  • 如何利用大数据进行价值兑现才是正经事(虎嗅网)

    如果有一天你可以预测未来 xff0c 你要做的第一件事情是什么 xff1f 买彩票 xff1f 第二件 第三件事情呢 xff1f 先卖个关子 xff0c 我们后面再说这件事情 大数据是个产业 xff0c 广义上指的是在这个信息过载时代围绕着
  • 多图震撼!数字的未来,2013报告(虎嗅网)

    新媒体 完爆 旧媒体 从市值上来看 xff0c 以苹果 谷歌 亚马逊 Facebook 雅虎等为首的新媒体公司市值已超过1万亿美元 xff0c 而以迪斯尼 Comcast 时代华纳 Viacom CBS 新闻集团 21世纪福克斯等为首的旧媒
  • 网页采集器-八爪鱼采集器

    八爪鱼采集器下载地址 xff1a http www bazhuayu cc download 八爪鱼采集器的注册地址 xff1a http www bazhuayu cc signup id 61 0e492e9c 6d80 4c2a a2
  • 考研书单与技巧

    书尽量在网上搞活动时买正版的 xff0c 这样也不贵 每科研究透一到两本书 xff0c 不要贪多 xff01 1 英语 xff1a xff08 积累的过程 xff0c 可以现在开始 xff0c 正好把六级过了 xff09 xff08 看好所
  • Ubuntu下程序进程堆栈信息——gstack

    前言 在Ubuntu下调试程序 xff0c 大部分是启动前使用gdb进行调试 xff0c 当然也有其他方法 xff0c 程序在运行中 xff0c 为了不打断程序正常运行 xff0c 也有一些工具进行调试 当前本文章旨在说明不安装其他额外程序
  • 9.针对Linux的8种最佳免费防病毒程序

    虽然Linux操作系统相当稳定和安全 xff0c 但它们可能不完全免疫威胁 所有计算机系统都可能遭受恶意软件和病毒攻击 xff0c 其中包括运行基于Linux的操作系统的系统 但是 xff0c 对于基于Linux的操作系统而言 xff0c
  • 有铅焊锡丝与无铅焊锡丝的性能差异大解析

    有铅焊锡丝与无铅焊锡丝是二大类差另外产物档次 xff0c 由于其金属成份差别造成熔点也差别 xff0c 一样通常有铅焊锡丝 的熔点在183度 xff0c 而无铅焊锡丝的熔点为217 227度 含铅量越少熔点将越高 由于焊锡丝的熔点温度进步之
  • linux中的系统调用

    前言 xff1a 本文只讨论linux中的系统调用 xff0c 不考虑windows等其他操作系统 两点 xff1a 1 系统调用时 xff0c 进程调用的是操作系统的内核函数 xff0c 不是进程 2 系统调用时 xff0c 会出现上下文
  • iView 日期选择器开始时间至结束时间限制

    需要考虑以下条件 开始时间和结束时间都不能大于当前时间开始时间不能大于结束时间 html lt FormItem label 61 34 起止时间 34 gt lt DatePicker type 61 34 date 34 v model
  • 树莓派3安装笔记(1)-安装操作系统Raspbian以及安装必要软件

    拿到了树莓派3后 xff0c 经过短暂的兴奋 xff0c 终于开始实战安装OS了 以下步骤基于官方的文章https www raspberrypi org learning software guide quickstart xff0c 选
  • C中需要检验其执行是否成功的函数(检验返回值)

    一 malloc xff08 xff09 因为当内存分配完了后 xff0c 就无法再分配空间了 xff0c 所以malloc失败也是有的是 xff0c 当malloc失败时返回NULL char s 61 void malloc SIZE
  • 《Java核心技术 卷1》

    目录 第4章 对象和类 lt 1 gt 静态字段和静态方法 lt 2 gt 初始化块 lt 3 gt 定义抽象类的对象变量 lt 4 gt hashCode方法得到散列码 lt 5 gt 虚拟机中的泛型类型信息 第五章 继承 第6章 接口
  • Kalibr 之 Camera-IMU 标定 (总结)

    Overview 欢迎访问 持续更新 xff1a https cgabc xyz posts db22c2e6 ethz asl kalibr is a toolbox that solves the following calibrati
  • VMware Workstations Pro 14 建立的虚拟机目录无法删除

    起因 通过VMware新建的RedHat虚拟机 xff0c 无意间的强制关机 xff0c 导致该虚拟机开机黑屏无法正常开启 xff0c 而且也关不掉 尝试删除自己创建的虚拟机目录文件 xff0c 提示文件被占用 通过任务管理器想要结束相关进
  • 矩形目标检测

    身份证 名片 书籍 考试试卷 答题卡这些检测目标都属于矩形目标检测 一 xff0c 现有技术 传统检测方法思路 xff1a 第一步 xff0c 采用滑动窗口 xff0c 设置不同的大小 xff0c 遍历图像 xff0c 得到一些目标的候选框