论文阅读:Image Partial Blur Detection and Classification

2023-10-29

 

1.论文主要解决的问题:

    (1).检测图片的模糊区域;

    (2).将模糊区域正确分类,主要分为等向性模糊(near-isotropoc blur)和定向运动模糊(directional motion blur)。下图(a)为定向运动模糊,(b)为等向模糊。

2.解决方法

2.1图像模糊区域检测

    论文提出三种用于图像模糊区域检测的方法:(1).Local Power Spectrum Slope ;(2).Gradient Histogram Span;(3).Local Autocorrelation Congruency.最后构造贝叶斯分类器结合三种方法实现模糊区域检测。

(1).Local Power Spectrum Slop

    本部分对形状为N×N的图片进行傅立叶变换,获得图片的功率谱S(u,v)

              

极坐标系下,上式可表示为(直角坐标系u,v在极坐标系下的表示为u = f cosθ , v = f sinθ):

             

根据论文论文1   ,功率谱近似等于:

             

    其中,A为每个方向的振幅缩放因子,α为頻域分量称之为功率谱斜率(slope of power spectrum)。根据以往研究,一个模糊图片图片的α值大部分分布在2~10之间,而非模糊的图片往往具有很小的α值。但是,不同图片具有不同的边界形状,其α值变化区间较大,所以仅仅通过α值判断图片模糊并不靠谱。论文提出了使用α的斜率判断图片的清晰程度。论文的第一个判断图片模糊公式如下:

                       

    使用q1计算图像局部是否模糊。其中为全局α值,为图片当前区域α值。

(2).Gradient Histogram Span

    本部分使用图片像素值梯度信息判断图片模糊区域。一般清晰图片边缘信息更加明显,所以梯度的方差分布具有更长的尾巴,而模糊图片颜色变化相对较小,所以其梯度大多集中于零附近。a,b两个图片红框为清晰部分,绿框为模糊部分。c,d中Empirical distribution 线条对应a,b中模糊区域(绿框)的梯度分布,e,f中Empirical distribution 线条对应a,b中清晰部分(红框)。论文使用两个高斯分布的加权和拟合图片的梯度分布:

                                    

其中,  ,是造成原始分布重尾的主要原因。

图片中Gaussian 1,Gaussian2 和Mixture Gaussion分别对应上式G1(加号左边),G2(加号右边)和加和后的分布。

但仅仅通过并不足以判断图片的模糊程度,比如白云的清晰照片也可能有较小的梯度变化。所以要结合图片梯度信息和区域的颜色变化区间来判断图片模糊。定义C:

其中Lmax 和Lmin分别为当前判断区域的像素最大值和最小值。

论文的第二个判断模糊公式为:

              

是个很小的值以防止分母为0,超参数,π为指定的参数,论文中π的值为25。

(3).Maximum Saturation

    本部分使用颜色饱和度来判断图像模糊。颜色饱和度:

            

论文的第三个判断模糊公式为:

                  

max(Sp)为当前区域(patch)颜色饱和度的最大值,max(So)为全图颜色饱和度最大值。

最后结合以上三种方式,构建贝叶斯分类器:

假设三种判断方法相互独立:

通过训练获得最佳判断参数。

(注:论文并没有给出最好效果的参数,需要自己调参哈)

2.2. 模糊分类

(由于本部分和项目无关,所以我只关注其大致思想,没关注相关的实现)

对于模糊的区域,使用自相关函数(Local autocorrelation function):

将其一阶泰勒展开:

求M的特征值 > )和对应的特征向量v1(x,y)和v2(x,y)。

1.对于定向模糊,边缘区域的梯度垂直于模糊方向,使得边缘梯度具有特定的方向。

2.对于等向模糊,梯度在各个角度均匀分布。

角点检测 给出了判断是否有方向的方法:

1.λ1,λ2都很小且近似,E在所以方向接近于常数;

2.λ1>>λ2,或者λ2>>λ1, E将在某一方向上很大;

3.λ1,λ2都很大且近似,E将在所有方向上很大;

如果λ1>>λ2则为定向模糊,否则为等向模糊。

论文使用的值构建不同角度的hist(θ)分布图,运动模糊的值主要分布在特定的区域,而等向模糊在各个方向具有大致相等的分布,所以其方差较大。

论文的模糊种类判别公式为:

                  

构建贝叶斯分类器:

       

通过训练获得最佳阈值。

3.Results

模糊检测(a)和模糊分类(b)的Precision-Recall曲线:

准确率:

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

论文阅读:Image Partial Blur Detection and Classification 的相关文章

  • 泊松重建算法原理介绍

    目录 1 泊松重建算法 2 泊松重建核心思想及原理 3 泊松算法流程 本文出自CSDN点云侠 原文链接 爬虫自重 把自己当个人 1 泊松重建算法 泊松重建是Kazhdan M在2006年提出的基于八叉树和泊松方程的一种网格三维重建算法 其本
  • 仅需一个样本即可定制个性化的SAM

    Personalize Segment Anything Model with One Shot https arxiv org pdf 2305 03048 pdf https github com ZrrSkywalker Person
  • 区域生长算法及其实现

    区域生长算法及其实现 背景 前面我们已经介绍了 最大熵分割法 OTSU算法 他们都有各自的优缺点 通常都不是单独使用这些算法 需要和其它算法来结合使用 前面两类算法都是单独对图像的灰度信息进行处理 不包含图像的空间信息 而区域生长算法则包含
  • SimMIM:一种更简单的MIM方法

    自从何恺明的MAE 点击蓝字查看文章详情 出来之后 基于MIM Masked Image Modeling 的无监督学习方法越来越受到关注 这里介绍一篇和MAE同期的工作 SimMIM A Simple Framework for Mask
  • 解决opencv读取(保存)不了路径为中文名的图片办法

    读取图片 img cv2 imdecode np fromfile inputpath dtype np uint8 1 保存图片 cv2 imencode jpg rotated img 1 tofile outpath jpg 按自己需
  • Opencv学习笔记(三)线性及非线性滤波

    大纲 1 滤波综述 2 方框滤波 3 均值滤波 4 高斯滤波 5 中值滤波 6 双边滤波 一 滤波综述 图像的滤波指的是在尽量保证图像细节特征的的情况下对图像中的噪声进行抑制 又因为图像的能量大部分集中在低频或者中频的区域 图像大部分区域是
  • opencv中resize错误可能导致的原因之一

    cv2 error OpenCV 4 5 5 1 error 5 Bad argument in function resize 在用resize时会产生这个错误 有可能时传入的图片不存在了 假如你是从摄像头读取的图片 需要通过 ret f
  • python人脸识别(转载)

    源码出处 http www cnblogs com AdaminXie 该项目笔记是基于下面博客的摘抄 Python 3 利用 Dlib 实现摄像头实时人脸识别 coneypo 博客园 cnblogs com Python 3 利用 Dli
  • 仅用61行代码,你也能从零训练大模型

    本文并非基于微调训练模型 而是从头开始训练出一个全新的大语言模型的硬核教程 看完本篇 你将了解训练出一个大模型的环境准备 数据准备 生成分词 模型训练 测试模型等环节分别需要做什么 AI 小白友好 文中代码可以直接实操运行 欢迎阅读体验 目
  • OpenCV 笔记(9):常用的边缘检测算子—— Roberts、Prewitt、Sobel

    在本文开始之前 我们先了解一下算子的概念 算子 英语是 Operator 它是一个函数空间到函数空间上的映射 O X X 广义上的算子可以推广到任何空间 函数 是从数到数的映射 泛函 是从函数到数的映射 算子 是从函数到函数的映射 算子不等
  • 张正友相机标定法原理与实现

    张正友相机标定法是张正友教授1998年提出的单平面棋盘格的相机标定方法 传统标定法的标定板是需要三维的 需要非常精确 这很难制作 而张正友教授提出的方法介于传统标定法和自标定法之间 但克服了传统标定法需要的高精度标定物的缺点 而仅需使用一个
  • 人工智能与底层架构:构建智能引擎的技术支柱

    导言 人工智能与底层架构的交融塑造了智能系统的基石 是推动智能时代发展的关键动力 本文将深入研究人工智能在底层架构中的关键作用 以及它对智能引擎的技术支持 探讨人工智能在计算机底层架构中的作用 以及这一融合如何塑造数字化未来 1 人工智能与
  • 目标检测深度学习的anchor

    在目标检测深度学习中 Anchor是一种预定义的框 用于在图像中采样不同位置 尺度和长宽比例的区域 作为目标检测模型的候选区域 Anchor是Faster R CNN等基于Anchor的目标检测算法的核心概念 具体来说 Anchor有以下几
  • 深度学习目标检测全连接层什么意思

    在深度学习目标检测中 通常我们使用卷积神经网络 Convolutional Neural Network CNN 进行特征提取 CNN 的主要结构包括卷积层和池化层 用于从输入图像中提取特征 然而 为了最终输出目标的类别和位置信息 通常在网
  • 讲解光流估计 liteflownet3

    目录 讲解光流估计 LiteFlowNet3 什么是 LiteFlowNet3 模型架构 训练与优化 应用与展望 结论 讲解光流估计 LiteFlowNet3 光流估计是计算机视觉领域的重要任务 其可以估计图像序列中每个像素的运动矢量 光流
  • 互操作性(Interoperability)如何影响着机器学习的发展?

    互操作性 Interoperability 也称为互用性 即两个系统之间有效沟通的能力 是机器学习未来发展中的关键因素 对于银行业 医疗和其他生活服务行业 我们期望那些用于信息交换的平台可以在我们需要时无缝沟通 我们每个人都有成千上万个数据
  • 澳鹏干货解答!“关于机器学习的十大常见问题”

    探索机器学习的常见问题 了解机器学习和人工智能的基本概念 原理 发展趋势 用途 方法和所需的数据要求从而发掘潜在的商机 什么是机器学习 机器学习即教授机器如何学习的过程 为机器提供指导 帮助它们自己开发逻辑 访问您希望它们访问的数据 机器学
  • 【图像配准】

    非配对配准 Non rigid registration 和配对配准 Rigid registration 是医学图像配准中常用的两种方法 它们有着不同的含义和应用 非配对配准 Non rigid registration 非配对配准是指将
  • 图神经网络与智能化创作艺术:开启艺术的智能时代

    导言 图神经网络 GNNs 与智能化创作艺术的结合为艺术领域带来了新的可能性 本文深入研究二者的结合方向 包括各自的侧重点 当前研究动态 技术运用 实际场景 未来展望 并提供相关链接 1 图神经网络与智能化创作艺术的结合方向 1 1 图神经
  • 文档扫描与矫正-仿射变换

    图像变换是计算机视觉和图像处理中的关键技术之一 它允许我们对图像进行各种形式的变形 调整和校正 其中 仿射变换是一种常见的变换方式 在文档扫描过程中 由于拍摄角度和畸变等原因 文档图像可能存在一定程度的形变 仿射变换可以用于校正文档图像 使

随机推荐

  • 什么是websocket协议

    websocket和http协议一样 都是基于tcp协议而发展起来的 在TCP两端 同一时间内 双方都可以主动向对方发送数据 这就是所谓的全双工 http协议 是基于tcp的 但是在同一时间内 客户端和服务器只能有一方主动发数据 这就是所谓
  • MapStruct中文文档(一)——定义映射器

    文章目录 3 定义映射器 3 1 基本映射 示例1 定义映射器的Java接口 3 2 映射组合 实验性功能 3 3 向映射器添加自定义方法 示例2 由抽象类定义的映射器 3 4 映射方法具有多个源参数 示例3 具有多个源参数的映射方法 示例
  • 基于Spring+SpringMVC+Mybatis 开发的web在线租房系统

    项目介绍 本项目包含用户端和管理端 采用JSP模板引擎渲染页面 使用Ajax实现前后端异步交互 用户端包含房屋列表 房屋详情 房屋筛选 租房 二手房 新房可按租金 出租方式 面积 房型进行筛选 按价格 发布时间进行排序 并提供登录 注册 收
  • 机器学习技术(五)——特征工程与模型评估

    机器学习技术 五 特征工程与模型评估 2 文章目录 机器学习技术 五 特征工程与模型评估 two 二 模型评估 1 Accuracy score 2 Confusion matrix混淆矩阵 1 多值 2 二值 3 Hamming loss
  • 使用antd3.x版本实现选择年份,并设置默认年份

    在使用antd3 x的时候 需要用到只选择年份的选择器 会遇到的很多问题 点击可以查看这个文档 可能会对你有所帮助 下面的代码的实现部分 import React Component from react import DatePicker
  • NNIE的运行机制

    NNIE的运行机制 一 背景 由于当前主流算法中都使用了深度学习算法 而深度学习算法在移植过程中 基于带有的NNIE推理单元的Hisi芯片将极大的提高算法模型的推理 加速算法计算 从而便于算法落地上车 故而本文将简要说明NNIE的运行机制
  • 基于深度学习的对联自动生成系统

    对联自动生成系统 1 项目目标 设计一个基于深度学习的对联生成系统 最终结果可以是一个简单的界面 在界面中 我输入一句上联 通过点击相应按钮 系统生成相应下联并显示出来 2 国内外相关工作 对联是属于我们中华民族独有的一种文学形式 国外研究
  • 类中的向上转型与向下转型详解

    我们的类与类之间会存在继承关系 子类继承父类 一个父类可以有多个子类 例如Animal类就可以有Cat子类 Dog子类 等等 那么我们在运用的时候根据不同的场景会出现向上转型和向下转型的情况 一 向上转型 1 Animal a1 new C
  • 【AntDB数据库】AntDB数据库迁移(三)

    导出导入数据 导入数据 导出的数据文件为copy命令的sql文件 可以直接使用psql f参数执行 但是在文件数量比较多的时候 建议采用脚本封装的方式 可控的进行数据导入 编写导入脚本 该脚本通过命令行参数来控制是通过表名查找文件导入还是按
  • Java AES加密与C#互转

    和外部系统对接的时候 对方要求用AES AES ECB PKCS5Padding对参数进行加密 给出的Java类如下 import org springframework util Base64Utils import javax cryp
  • c语言int型变量写入char数组的方法

    c语言int型变量写入char数组的方法 include
  • android开发使用 ndk-stack 打印崩溃日志

    使用 ndk stack 的时候需要你的 lib 编译为 debug 版 通常需要下面的修改 1 修改 android mk 增加 为 LOCAL CFLAGS 增加 g 选项 2 修改 application mk 增加 APP OPTI
  • 这套浙大出品的Python简直就是学习Python界的天花板

    教材PDF PTT课件 源码PPT等 相信我真的很容易上手 文末领取 关于Python技术储备 学好 Python 不论是就业还是做副业赚钱都不错 但要学会 Python 还是要有一个学习规划 最后大家分享一份全套的 Python 学习资料
  • jQuery 入门教程(28): jQuery UI Datepicker 示例(一)

    jQuery UI提供的Datepicker 是一个有着非常灵活配置的选择日期的UI组件 你可以配置显示日期的格式 语言 限制所能选择的日期范围 添加按钮等 基本用法如下 1 lt doctype html gt 2
  • YOLACT

    论文 YOLACT Real time Instance Segmentation 2019 作者 Daniel Bolya Chong Zhou Fanyi Xiao Yong Jae Lee 团队 University of Calif
  • 等保合规2022系列

    2022等保合规指南 第四篇 山石网科带你深入走进 等保 通过 等保合规2022系列 今年 关于等保你该了解什么 等保合规2022系列 一个中心 三重防护 助力企业等级保护建设更科学 以及 等保合规2022系列 20余年来 等级保护在如何
  • 使用Python爬虫获取豆瓣影评,并用词云显示

    使用Python爬虫获取豆瓣影评 并用词云显示 Python语言流行到现在 目前最受开发者喜爱的功能莫过于它的爬虫功能 以至于很多人以为Python的英语发音也是 爬虫 其实它是读作 啪善 pa n 而爬取网络信息 只是它的一个功能 它同时
  • python:鸡兔同笼,已知鸡兔总头数为 h,总腿数为 f,编写程序计算鸡兔各有多少只。

    h eval input 请输入鸡兔的总头数 f eval input 请输入鸡兔的总腿数 fowl 4 h f 2 rabbit h fowl print 笼中有 只鸡和 只兔子 format fowl rabbit
  • 【OpenCV4】绘制直方图,调用calcHist()函数(图片美化版本)

    文章目录 calcHist 函数详解 绘制直方图的代码 测试图片 生成的直方图 calcHist 函数详解 具体请参考 https blog csdn net qq 42067550 article details 122533459 绘制
  • 论文阅读:Image Partial Blur Detection and Classification

    1 论文主要解决的问题 1 检测图片的模糊区域 2 将模糊区域正确分类 主要分为等向性模糊 near isotropoc blur 和定向运动模糊 directional motion blur 下图 a 为定向运动模糊 b 为等向模糊 2