基于深度学习的高分辨率遥感图像目标检测技术目前的研究现状

2023-10-29

参考   基于深度学习的高分辨率遥感图像目标检测技术目前的研究现状 - 云+社区 - 腾讯云

目录

一、概述

二、通用目标检测方法

1、类不平衡问题

2、复杂背景

3、目标的尺度变化

4、特殊视角

5、小目标

三、特定目标检测

1、城市

2、机场

3、建筑

4、飞机

5、舰船

6、车辆

7、云

8、海冰

四、参考文献


一、概述

高分辨率遥感目标检测目前的研究成果主要分为两类,特定目标检测和一般目标检测。特定目标检测主要包括城市[1]、机场[2]、建筑[3]、飞机[4]、舰船[5]-[6]、车辆[7]-[8]、云[9]、海冰[10]等遥感图像中比较重要和有价值的目标。一般目标检测研究的问题主要是目标检测中面临的难题,主要面临的问题主要有:类不平衡[11]、复杂背景[12]、目标的尺度变化[13]、特殊视角[14]-[16]、小目标[17]-[18]等问题。下面分别的一般目标检测和特定目标检测进行介绍(特定目标检测当然还包含其他许多类,这里我们不能一一列出。不少文献还提出了数据集,这里我们只介绍方法。

二、通用目标检测方法

1、类不平衡问题

类不平衡在自然图像和遥感图像中都是普遍存在的问题,主要是指在提取proposal的时候大量的proposal为背景在训练的时候会主导梯度下降造成训练器的性能下降,针对类不平衡问题在自然图像的目标检测中提出了许多方法,比如focal loss、GHM、OHME等方法。

  • Random Access Memories: A New Paradigm for Target Detection in High Resolution Aerial Remote Sensing Images.

作者提出了一种小目标先验条件下高分辨率航空遥感图像目标检测的新方法。以往的遥感目标检测方法将检测定义为检测模型的学习+类标签和框坐标的推理。作者贝叶斯的观点出发,在推理阶段,通过训练和观察,自适应地更新检测模型,使其后验值最大化。称为“RAM”。在该范式中,“记忆”可以理解为从训练数据中学习到的任何模型分布,“随机访问”是指在检测阶段访问记忆并随机调整模型,以获得对任何不可见的测试数据分布更好的适应性。

2、复杂背景

复杂背景指的是相对于自然图像遥感图像由于视野更广,而在自然图像中背景一般比较单一。比如自然图像中传感器得到的车辆(比如pascal voc和coco数据集)背景一般是街道、房屋、天空,而在遥感图像的背景比较多样化,比如城市、森林、草原、沙漠都可能有车辆。因此复杂背景下的目标检测是一个很重要的问题。

  • Multiscale Visual Attention Networks for Object Detection in VHR Remote Sensing Images.

作者提出了一种端到端多尺度视觉注意网络(MS-VANs)方法。使用跳跃连接的编解码器模型从全尺寸图像中提取多尺度特征。对于每个尺度的特征图,我们学习了一个视觉注意网络,然后是一个分类分支和一个回归分支,突出目标区域的特征,抑制背景的杂乱。用一个混合损失函数训练MS-VANs模型,该函数是注意损失、分类损失和回归损失的加权和。

3、目标的尺度变化

多尺度变化是指同一类目标的大小之间发生变化,而小目标问题指的是目标相对于整幅图像的大小,在自然图像中多尺度方法也是个热点问题。

  • Hierarchical and Robust Convolutional Neural Network for Very High-Resolution Remote Sensing Object Detection.

本文提出了一种分层鲁棒CNN。首先,提取多尺度卷积特征来表示层次空间语义信息。其次,将多个全连通的层特征叠加在一起,提高旋转和缩放的鲁棒性。

4、特殊视角

在自然图像中目标多是水平的,而在遥感图像由于星载和机载图像传感器只能俯拍,因此相对于自然图像视角比较特殊。因此俯视下的目标检测和目标的旋转不变性是很重要的问题。

  • Learning Rotation-Invariant Convolutional Neural Networks for Object Detection in VHR Optical Remote Sensing Images.

本文提出了一种新颖有效的学习旋转不变CNN (RICNN)模型的方法,通过在现有CNN体系结构的基础上引入并学习新的旋转不变层来提高目标检测的性能。有别于传统的CNN模型的训练,只有优化了多项逻辑回归客观,RICNN模型训练通过优化一个新的目标函数通过正则化约束,明确执行训练样本的特征表示的旋转映射前后相互接近,因此实现旋转不变性。为了便于训练,首先对旋转不变层进行训练,然后对整个RICNN网络进行域特定的微调,以进一步提高性能。

  • Rotation-Insensitive and Context-Augmented Object Detection in Remote Sensing Images.

提出了一种基于深度学习的遥感图像目标检测框架,包括区域建议网络(RPN)和遥感图像局部上下文特征融合网络。具体地说,RPN在传统的多尺度、多展弦比锚的基础上,还增加了多角度锚,从而可以处理地理空间对象的多角度、多尺度特征。为了解决外观模糊问题,我们提出了一种双通道特征融合网络,它可以沿着两个独立的路径学习局部和上下文属性。为了形成一个强大的联合表示,这两种特征在最后的处理层中进行了组合。

  • ORSIm Detector: A Novel Object Detection Framework in Optical Remote Sensing Imagery Using Spatial-Frequency Channel Features.

本文提出了一种新的目标检测框架,称为光学遥感图像检测器(ORSIm检测器),集成了多种通道特征提取、特征学习、快速图像金字塔匹配和增强策略。ORSIm检测器采用了一种新颖的空频信道特征(SFCF),综合考虑了频域内构造的旋转不变信道特征和原始的空间信道特征(如颜色信道和梯度幅度)。

5、小目标

由于遥感图像一般视野比较大,因此目标相对于图像的尺寸更小,小目标和微小目标是一个重点也是一个难点问题。

  • Accurate Object Localization in Remote Sensing Images Based on Convolutional Neural Networks.

针对小目标定位性能比较差,作者提出了一种基于无监督分数的边界盒回归(USB-BBR)算法,并结合非最大抑制算法对检测到的目标区域的边界盒进行优化。

  • R²-CNN: Fast Tiny Object Detection in Large-Scale Remote Sensing Images.

针对遥感图像大尺度大场景下的微小目标,作者提出了Tiny-Net的目标检测方法。可以在29.4秒内在卷积神经网络(R2-CNN)中处理GF-1图像,它由主干Tiny-Net、中间全局注意块、最终分类器和检测器组成。Tiny-Net是一种轻量级的残差结构,它支持从输入中快速而强大地提取特性。全局注意块建立在Tiny-Net上,以抑制误报。然后利用分类器来预测每个patch中目标的存在,如果有合适的检测器来精确定位目标。通过端到端训练,使分类器和检测器相互增强,进一步加快了处理速度,避免了在Titian X上只使用单线程。

三、特定目标检测

1、城市

  • Urban Area Detection in Very High Resolution Remote Sensing Images Using Deep Convolutional Neural Networks.

本文提出了一种基于DCNNs的城市区域检测方法。该方法主要包括三个步骤:(1)基于预先训练的DCNNs提取的深度特征,得到可视化字典;(二)城市词汇从标注的图像中习得;(iii)基于最近的字典词准则,在新的图像中检测城市区域。

2、机场

  • Airport Extraction via Complementary Saliency Analysis and Saliency-Oriented Active Contour Model.

本文构建了一个高效的RSIs机场提取框架。在第一步中,提出了一种将面向视觉的显著性和面向知识的显著性相结合的机场位置估计的双向互补显著性分析(CSA)方案。在第二步中,构造了一个用于机场轮廓跟踪的显著性主动轮廓模型(SOACM),在基于水平集的能量函数中引入了显著性方向项。在CSA获得的显著性特征表示的指导下,SOACM可以获得定义良好、精度较高的目标轮廓。

3、建筑

  • Building Detection from Satellite Imagery using Ensemble of Size-Specific Detectors.

提出了一个简单但有效的多任务模型。该模型学习多个探测器,每个探测器都专门用于特定大小的建筑物。此外,该模型通过同时训练道路提取任务和建筑物检测任务,隐式地利用上下文信息。道路提取器是通过从另一个预先训练过的CNN中提取知识来训练的,在它的训练中不需要道路的标签。

4、飞机

  • Weakly Supervised Learning Based on Coupled Convolutional Neural Networks for Aircraft Detection.

本文提出了一种基于耦合卷积神经网络(CNNs)的飞机检测弱监督学习框架,可以同时解决这些问题。首先,开发一种基于cnn的方法来提取对象的高级特征和层次特征表示。然后利用迭代弱监督学习框架,从原始图像中自动挖掘和扩充训练数据集。然后提出了一种耦合CNN方法,将候选区域建议网络和定位网络相结合,提取建议并同时定位飞机,即使在大规模的VHR图像中,这种方法也更高效、准确。

5、舰船

  • Vessel detection and classification from spaceborne optical images: A literature survey.

本文综述了从光学卫星图像中对舰船进行探测和分类的现有文献。尽管合成孔径雷达(SAR)仍然是海上监测的主导技术,但基于光学卫星数据的研究数量正在迅速增长。从1978年到2017年3月,一共分析了119篇关于光学舰船检测和分类的论文。我们首先介绍了所有现有的用于船只探测的传感器系统,但随后只关注光学成像卫星。本文阐述了光学卫星特性的时间发展,并将其与舰船探测出版物的数量和频率联系起来。在详细介绍了基于光学图像的舰船检测与分类方法的基础上,结合已实现的检测精度,提出了将光学数据与其他数据源融合的可能性。研究表明,影响舰船探测精度最常见的因素是:影响海面特征的不同天气条件、云量和霾量、太阳角度、成像传感器特征。所有这些因素在选择最合适的方法时带来很大的差异;有些挑战仍未得到解决。为了获得更高的相关性和更广泛的应用,本文建议用于检测和分类的算法应该支持多种目标和气象条件,理想情况下还应该支持多种光学卫星传感器。至少,它们应该在不同的条件下对许多图像进行测试。这在现有的文献中并不常见。我们还注意到,许多作者忽略了适当的性能量化,这对于实际评估和对现有算法的数值比较非常关键。综上所述,星载光学图像船舶监控是一个热门的研究课题,由于卫星数据量大,其中大部分数据是免费开放的,因此在不久的将来具有很大的应用潜力。

  • HSF-Net: Multiscale Deep Feature Embedding for Ship Detection in Optical Remote Sensing Imagery.

本文提出了一种新的基于深度特征的舰船遥感图像检测方法。该方法利用深度卷积神经网络生成的特征图,利用区域建议网络生成候选船舶。为了有效地检测不同尺度的舰船,提出了一种分层选择滤波层,将不同尺度的特征映射到同一尺度空间。提出的方法是一种端到端网络,可以同时检测几十个像素到数千个像素的近岸和近岸船只。

6、车辆

  • R^3-Net: A Deep Network for Multioriented Vehicle Detection in Aerial Images and Videos.

本文提出了一种新的深度网络——可旋转区域残差网络(R3-Net),用于检测航空图像和视频中的多目标车辆。更特别的是,利用R3-Net在半坐标系中生成可旋转的矩形目标盒。首先,使用可旋转区域建议网络(R-RPN)从深度卷积神经网络生成的特征图中生成可旋转的兴趣区域(R-RoIs)。在此,提出了一种批量平均可旋转锚定策略来初始化候选车辆的形状。接下来,提出了一个可旋转检测网络(R-DN)来对r - roi进行最终的分类和回归。在R-DN中,设计了一种新的可旋转位置敏感池,在对r - roi特征图进行降采样的同时,同时保持位置和方向信息。在最终的模型中,R-RPN和R-DN可以联合训练。

  • Object-based detection of vehicles using combined optical and elevation data.

本文提出了一个工作流程,利用光学和高程数据检测车辆在遥感城市数据。该工作流包括三个连续的阶段:候选识别、分类和单个车辆提取。与以前的大多数方法不同,这两个数据源的融合在所有阶段都得到了强烈的需求。第一个阶段利用的是大多数人造物体都是矩形的事实,第二个和第三个阶段利用结合特定特征的机器学习技术。这些阶段的设计是为了处理多个传感器的输入,这导致了一个显著的改进。

7、云

  • Cloud Detection in Remote Sensing Images Based on Multiscale Features-Convolutional Neural Network.

本文提出了一种基于多尺度特征的卷积神经网络(MF-CNN)同时检测遥感图像薄云、厚云和非云像素的方法。利用不同云层覆盖水平的landsat8卫星图像验证了提出的MF-CNN模型的有效性。我们首先对landsat8图像的可见光、近红外、短波、卷云和热红外波段进行叠加,得到综合的光谱信息。然后使用TheMF-CNN模型学习输入图像的多尺度全局特征。将特征学习过程中获取的高层语义信息与低层空间信息相结合,将图像划分为厚、薄、非云区域。在定性和定量两方面,将所提出的模型与各种常用的云检测方法进行了比较。

8、海冰

  • Sea Ice Sensing From GNSS-R Data Using Convolutional Neural Networks.

设计了一种基于分类的海冰检测CNN和基于回归的SIC估计CNN。这里以DDM图像作为输入,将Nimbus-7扫描多通道微波辐射计和国防气象卫星计划专用传感器微波成像仪的SIC数据修改为目标输出。在实验阶段,输入全尺寸DDM数据(128×20像素)得到的CNN输出结果比现有的基于nnn的方法精度更高。此外,还对进一步处理输入数据(40×20像素,每张图像中位置固定)的CNNs和NNs进行了评估,提高了两种网络的性能。

四、参考文献

  1. Tian, T., et al. (2018). Urban Area Detection in Very High Resolution Remote Sensing Images Using Deep Convolutional Neural Networks.
  2. Zhang, Q., et al. (2018). "Airport Extraction via Complementary Saliency Analysis and Saliency-Oriented Active Contour Model." IEEE Geoscience and Remote Sensing Letters 15(7): 1085-1089.
  3. Hamaguchi, R. and S. Hikosaka (2018). Building Detection from Satellite Imagery using Ensemble of Size-Specific Detectors. 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW).
  4. Zhang, F., et al. (2016). "Weakly Supervised Learning Based on Coupled Convolutional Neural Networks for Aircraft Detection." IEEE Transactions on Geoscience and Remote Sensing 54(9): 5553-5563.
  5. Kanjir, U., et al. (2018). Vessel detection and classification from spaceborne optical images: A literature survey.
  6. Li, Q., et al. (2018). "HSF-Net: Multiscale Deep Feature Embedding for Ship Detection in Optical Remote Sensing Imagery." IEEE Transactions on Geoscience and Remote Sensing 56(12): 7147-7161.
  7. Li, Q., et al. (2019). "R3-Net: A Deep Network for Multioriented Vehicle Detection in Aerial Images and Videos." IEEE Transactions on Geoscience and Remote Sensing 57(7): 5028-5042. 
  8. Schilling, H., et al. (2017). Object-based detection of vehicles using combined optical and elevation data.
  9. Shao, Z., et al. (2019). "Cloud Detection in Remote Sensing Images Based on Multiscale Features-Convolutional Neural Network." IEEE Transactions on Geoscience and Remote Sensing: 1-15.
  10. Yan, Q. and W. Huang (2018). "Sea Ice Sensing From GNSS-R Data Using Convolutional Neural Networks." IEEE Geoscience and Remote Sensing Letters 15(10): 1510-1514.
  11. Zou, Z. and Z. Shi (2018). "Random Access Memories: A New Paradigm for Target Detection in High Resolution Aerial Remote Sensing Images." IEEE Transactions on Image Processing 27(3): 1100-1111.
  12. Wang, C., et al. (2018). Multiscale Visual Attention Networks for Object Detection in VHR Remote Sensing Images.
  13. Zhang, Y., et al. (2019). Hierarchical and Robust Convolutional Neural Network for Very High-Resolution Remote Sensing Object Detection.
  14. Cheng, G., et al. (2016). "Learning Rotation-Invariant Convolutional Neural Networks for Object Detection in VHR Optical Remote Sensing Images." IEEE Transactions on Geoscience and Remote Sensing 54(12): 7405-7415.
  15. Li, K., et al. (2018). "Rotation-Insensitive and Context-Augmented Object Detection in Remote Sensing Images." IEEE Transactions on Geoscience and Remote Sensing 56(4): 2337-2348.
  16. Wu, X., et al. (2019). "ORSIm Detector: A Novel Object Detection Framework in Optical Remote Sensing Imagery Using Spatial-Frequency Channel Features." IEEE Transactions on Geoscience and Remote Sensing 57(7): 5146-5158.
  17. Long, Y., et al. (2017). "Accurate Object Localization in Remote Sensing Images Based on Convolutional Neural Networks." IEEE Transactions on Geoscience and Remote Sensing 55(5): 2486-2498.
  18. Pang, J., et al. (2019). "R²-CNN: Fast Tiny Object Detection in Large-Scale Remote Sensing Images." IEEE Transactions on Geoscience and Remote Sensing: 1-13.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

基于深度学习的高分辨率遥感图像目标检测技术目前的研究现状 的相关文章

  • 【vue、uni-app】文本信息的完全显示(回车换行、连续空格、数字&英文换行)

    vue uni app 文本信息的完全显示 回车换行 连续空格 数字 英文换行 数据说明 完整显示 一 vue端 1 不做处理的效果 2 处理后 二 uni app端 1 不做处理的效果 2 处理后 总结 记录学习的轨迹 2021 12 0
  • 线程知识点补充

    全局解释器锁GIL 是什么 GIL本质也是一把互斥锁 将并发变成串行 降低效率以保证数据的安全性 每有一个进程 进程内就必然有一个用来执行代码的线程 也会有一个用来执行垃圾回收的线程 为了避免执行代码的线程和执行垃圾回收的线程对同一份数据进

随机推荐

  • golang 单元测试、性能测试、性能监控技术

    golang 单元测试 性能测试 性能监控技术 go语言提供了强大的测试工具 下面举例简单介绍一下 go test 单元测试 go test bench 性能测试 go tool pprof 性能监控 go test 单元测试 例如对包he
  • 至强服务器性能排行,英特尔至强处理器排名天梯 至强cpu天梯2020排名

    排名 名称 评分 1 Intel Xeon Platinum 8173M 2 00GHz 28 860 2 Intel Xeon Gold 6154 3 00GHz 27 722 3 Intel Xeon Gold 6138 2 00GHz
  • 【研究生】毕业答辩PPT制作和讲述要点(整理)

    引用网址 http blog sciencenet cn blog 53846 232974 html 引言 在QQ群上和研三的点评答辩ppt制作结果 不知不觉 唠叨 了很多 其中 让大家共享一下彼此的ppt文档 取人所长 不想 学生杨涛有
  • React SSR - 写个 Demo 一学就会

    今天写个小 Demo 来从头实现一下 react 的 SSR 帮助理解 SSR 是如何实现的 有什么细节 什么是 SSR SSR 即 Server Side Rendering 服务端渲染 是指将网页内容在服务器端中生成并发送到浏览器的技术
  • BTC-分叉

    分叉 fork 原来由一条链变为了两条链 造成原因 有可能是两个节点差不多同时挖到了一个区块 然后同时发布出去 这时候就会造成临时性的分叉 state fork forking attack deliberate fork 比特币的协议发生
  • 扫码普通二维码跳转微信小程序指定页面(体验服和开发服跳转链接不能动态传参)

    好久不见 时隔多年我又来记录问题来了 记录这次问题的主要原因是减少你我去搜索资源的时间 下面开始讲讲我越到的问题 下面说的是针对小程序体验版或者开发版哈 正式环境不存在这个问题 需求 pc端扫码登录 pc创建一个二维码 用户用微信自带扫码功
  • Python 中 Iterator和Iterable的区别

    Python中 list truple str dict这些都可以被迭代 但他们并不是迭代器 为什么 因为和迭代器相比有一个很大的不同 list truple map dict这些数据的大小是确定的 也就是说有多少事可知的 但迭代器不是 迭
  • STM32CubMX_MQ135检测空气质量

    一 MQ135简介 MQ135是测量空气污染情况常用的一个传感器 具有代表性 价格低 寿命长 敏感度也OK 主要用于测量空气中二氧化碳 氮氧化物 氨气 酒精 苯类等 这几样气体可以说都属于家用空气污染测定中的重要成份 因此用这个传感器刚刚好
  • BOT_SORT复现(Ubuntu20.04)

    论文地址 https arxiv org abs 2206 14651 代码地址 NirAharon BoT SORT BoT SORT Robust Associations Multi Pedestrian Tracking githu
  • tensorflow:使用卷积网络(CNN)实现mnist

    tensorflow1 8 0 python3 6 4 coding utf 8 import tensorflow as tf from tensorflow examples tutorials mnist import input d
  • 【adb 查看手机当前应用的包名,所有应用的包名以及安装位置】

    1 查看是否连接手机 adb devices 2 进入指定的device的shell adb shell 3 查看当前正在运行的APK的包名 adb shell dumpsys window findstr mCurrentFocus 例如
  • BigInteger 与 BigDecimal的区别

    目录 一 BigInteger 二 BigDecimal 一般来说 BigInteger用的不是很多 BigDecimal用的稍微多一点 就比如说JDBC中 如果一个字段的数据库类型是Number 那么 getObject getClass
  • ES6中声明变量的方法(let,const)

    ECMAScript 6 0 以下简称ES6 是JavaScript语言的下一代标准 已经在2015年6月正式发布了 它的目标 是使得JavaScript语言可以用来编写复杂的大型应用程序 成为企业级开发语言 ECMAScript和Java
  • Android版本大于M时动态申请权限的方法

    问题描述 Android应用开发时 若版本大于M 则有些权限需要在运行时用Java代码进行动态获取 解决方案 添加supportv7包 在build gradle app 文件dependencies节点中 添加v7包的依赖 impleme
  • linux java进程_Java+Linux,深入内核源码讲解多线程之进程

    之前写了两篇文章 都是针对Linux这个系统的 为什么 我为什么这么喜欢写这个系统的知识 可能就是为了今天的内容多线程系列 现在多线程不是一个面试重点 啊 那如果你能深入系统内核回答这个知识点 面试官会怎么想 你会不会占据面试的主动权 我不
  • c# mysql 二进制图片_ASP.NET(C#) 实现将图片以二进制保存到数据库中 转

    注意 上传大文件时 会出现错误 原因我现在还不知道 数据库名 mydata 表名 table img 字段 id 自动编号 filename 文本 img OLE 对象 default aspx 无标题页 default aspx cs u
  • 【电路】电容(三)——耦合、退耦电容

    一 耦合电容 什么是耦合 两个或两个以上的电路构成一个网络时 若其中某一电路中电流或电压发生变化 能影响到其他电路也发生类似的变化 这种网络叫做耦合电路 耦合的作用就是把某一电路的能量输送 或转换 到其他的电路中去 1 电源 导线 电阻 电
  • 蓝牙core_v5.2协议-4 L2CAP上

    本章节主要讲述蓝牙host层的协议 针对BLE 主要关注L2CAP GATT ATT SMP GAP这几层 根据spec的章节顺序 我们一次讲解 PART A A LOGICAL LINK CONTROL AND ADAPTATION PR
  • python的time各种用法

    1 time Python的time模块提供了许多用于处理时间的功能 以下是一些常用的time模块的函数及其用法 并附有示例 time 返回当前时间的时间戳 自1970年1月1日00 00 00起的秒数 import time curren
  • 基于深度学习的高分辨率遥感图像目标检测技术目前的研究现状

    参考 基于深度学习的高分辨率遥感图像目标检测技术目前的研究现状 云 社区 腾讯云 目录 一 概述 二 通用目标检测方法 1 类不平衡问题 2 复杂背景 3 目标的尺度变化 4 特殊视角 5 小目标 三 特定目标检测 1 城市 2 机场 3