【超分辨率】Zoom to Learn, Learn to Zoom

2023-05-16

前几天陈启峰大佬在我司内部分享几篇关于图像增强的文章.其中就有这篇。这篇文章是超分辨率落地的一个比较重要的文章,跟以往自己去做高/低分辨率数据集不同,本文采取了单反直接去制作数据集,在真实场景上效果非常好。本文也被CVPR2018接收了。

论文名称:Zoom to Learn, Learn to Zoom

背景:

与以往的超分辨率算法不同,本文并没有去对高分辨率图像进行bicubic降采样来制作低分辨率图片。这类低分辨率图像往往不满足真实的低分辨率图像分布,因此经常会出现比较尴尬的事情就是在标准数据集上效果很不错,而到真实应用的时候,效果太弱。或是增强了原低分辨率图像上的artifacts。
在这个背景下,本文直接去用单反去拍摄图片,高分辨率的图像由长焦距拍摄,低分辨率图像用短焦距去拍摄。此处需要注意的是,本文训练的数据均是Raw Data,这是专业单反拍摄的格式,而RGB图片是Raw Data经过图像处理器(Image SIgnal Processer, ISP)制作的,在某种程度上来说,RGB图片也是有损的。
由于本文采取自己制作数据集,因此需要对同一个图像进行对准,然而相机上的不同配置很难将高低分辨率图像进行完整对齐。在本文使用的单反,8M分辨率拍摄的图像会有40-50pixel的偏差。因此这将与之前的超分辨率算法不同,低分辨率图像与高分辨率图像的位置是一一对应的。本文第二个insight就是提出coBi损失函数,能够对这种misalignment很好的进行处理。

本文两个insight

  • 1 train CNN from Raw Data
  • 2 CoBi Loss function

Raw Data

我们知道RGB图像是三通道图像,每一个通道分别对应着R,G,B通道。本文采取直接去提取单反拍摄的raw bayer data。
这里简单的介绍一下什么是bayer马赛克
在这里插入图片描述
左边这种RGB如此排列的称之为Bayer马赛克,右边是另一种Raw Data 格式Xtrans,此处暂且不表,感兴趣可以查看 https://petapixel.com/2017/03/03/x-trans-vs-bayer-sensors-fantastic-claims-test/

CoBi Loss:

Contextual Bilateral Loss: 是由contextual loss改进而来,此处回顾一下contextual loss(CX), 该损失函数是为了训练非对其数据。假如Source Image P存在一系列的feature points p i N p_i^N piN,目标图像Q存在一系列的feature points q j M q_j^M qjM
。对于每一个源特征p都会去检索最近邻q,并讲其match程度作为 q = a r g m i n D ( p , q j ) j M q=argminD(p,q_j)^M_j q=argminD(p,qj)jM。那么给定输入图像P和目标图像Q,CX Loss就是去minimize 这个match程度。
C X ( P , Q ) = 1 N ∑ i N m i n ( D p i , q j ) CX(P,Q) = \frac{1}{N} \sum^N_i min(D_{p_i, q_j}) CX(P,Q)=N1iNmin(Dpi,qj)

事实上作者去用这个loss去训练模型发现会出现很多artifacts。作者认为这是由于CX损失函数中不准确的特征匹配造成的。
受到保边滤波器的启发, 作者将空间区域也加入到损失函数中,得到本文的第二个insight,Contexual Bilateral Loss:
C o B i ( P , Q ) = 1 N ∑ i N m i n ( D p i , q j + w s D p i , q j ′ ) CoBi(P,Q) = \frac{1}{N} \sum^N_i min(D_{p_i, q_j} + w_{s} D_{p_i, q_j}') CoBi(P,Q)=N1iNmin(Dpi,qj+wsDpi,qj)
其中:
D p i , q j ′ = ∣ ∣ ( x i , y i ) − ( x j , u j ) ∣ ∣ 2 D_{p_i,q_j}' = || (x_i, y_i) - (x_j, u_j)||_2 Dpi,qj=(xi,yi)(xj,uj)2
另外作者借鉴感知损失,引入VGG loss。
本文最终的Loss为:
C o B i ( P , Q ) + λ C o B i v g g ( P , Q ) CoBi(P,Q) + \lambda CoBi_{vgg}(P,Q) CoBi(P,Q)+λCoBivgg(P,Q)

实验结果

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【超分辨率】Zoom to Learn, Learn to Zoom 的相关文章

  • 二、Scikit-Learn简介

    参考url https jakevdp github io PythonDataScienceHandbook index html Scikit Learn为各种常用机器学习算法提供了高效版本 xff0c 因其干净 统一 管道命令式的AP
  • scikit-learn_Scikit Learn-简介

    scikit learn Scikit Learn 简介 Scikit Learn Introduction In this chapter we will understand what is Scikit Learn or Sklear
  • Scikit-Learn简介

    写给自己的备忘 1 简介 对 Python 语言 有所了解的科研人员可能都知道 SciPy 一个开源的基于 Python 的科学计算工具包 基于 SciPy xff0c 目前开发者们针对不同的应用领域已经发展出了为数众多的分支版本 xff0
  • 【超分辨率】Zoom to Learn, Learn to Zoom

    前几天陈启峰大佬在我司内部分享几篇关于图像增强的文章 其中就有这篇 这篇文章是超分辨率落地的一个比较重要的文章 xff0c 跟以往自己去做高 低分辨率数据集不同 xff0c 本文采取了单反直接去制作数据集 xff0c 在真实场景上效果非常好
  • Zoom to Learn, Learn to Zoom

    Abstract 本文表明 xff0c 将机器学习应用于数字变焦时 xff0c 对真实 原始的传感器数据进行操作是有益的 现有的基于学习的超分辨率方法不使用真实的传感器数据 xff0c 而是对经过处理的RGB图像进行操作 我们表明 xff0
  • 安装scikit-learn问题

    1 问题描述如下 xff1a pytorch root 64 cento conda install scikit learn Solving environment failed CondaHTTPError HTTP 000 CONNE
  • 机器学习-scikit-learn

    文章目录 前言线性回归模型 LinearRegression准备数据集使用LinearRegression总结 前言 scikit learn是Python中最流行的机器学习库之一 xff0c 它提供了各种各样的机器学习算法和工具 xff0
  • Meta-learning:Learn to learn

    基于李宏毅教授的ML课程做的笔记 xff0c 主要供自己复习 xff0c 所以就留下了一些自己想多看的东西 xff0c b站有全面的课程视频 引言 xff1a 为什么few shot任务常常提及元学习meta learning xff1f
  • Git learn

    分布式版本控制系统 Git https git scm com 一 初始化 init xff0c 添加 add 到暂存区 stage xff0c 提交 commit 到版本库 master 二 工作区 xff0c 版本库 状态 status
  • Meta-Learning: Learning to Learn Fast

    Meta Learning Learning to Learn Fast 元学习 学习如何学习 译 原文 本文与原文基本没有区别 xff0c 仅供个人学习记录 电子笔记本 前言 xff1a 元学习解决 xff1a 遇到没有见过的任务 xff
  • imbalanced-learn API 传送门

    imbalanced learn API API详情可见User guide 或者见我的其余四篇关于imblearn的博客 即我翻译的doc 1 python imblearn toolbox 解决数据不平衡问题 一 imblearn简介
  • 如何在 Ubuntu 20.04 上安装 Zoom

    Zoom是一个易于使用的通信平台 集云视频会议 实时消息传递和内容共享于一体 使用 Zoom 您可以举办网络研讨会 组织在线会议以及创建会议室 本指南介绍如何在 Ubuntu 20 04 上安装 Zoom 相同的说明适用于所有基于 Debi
  • 使用MATLAB做传热学分析及后处理——CFDTool 官方例程

    目录 前言 1 环境配置 2 问题背景 3 传热学例程 heat transfer3 最后 中国加油 武汉加油 前言 cfdtool 官网 https www cfdtool com 是一个MATLAB的扩展工具箱 既然看到这个CFD问题了
  • React 16官网 (main concepts) 浏览

    翻译一下官网 顺便了解一下React 16版本的新特性 照旧 从Hello World开始 ReactDOM render h1 Hello world h1 document getElementById root 在集成了React的必
  • 如何在 Ubuntu 20.04 上安装 Zoom

    Zoom 应用程序是当今最流行的应用程序之一 Zoom 云会议应用程序通过互联网上的实时消息传递和内容共享提供简化的视频会议 Zoom 客户端允许您无需登录应用程序即可加入会议 要开始新会议 您需要登录该应用程序 访问zoom us创建帐户
  • I/O模型

    参考链接 I O多路复用 IO多路复用之select poll epoll详解 epoll讲解 深入Go语言网络库的基础实现 I O模型 I O模型 1 1 阻塞I O模型 最常用的I O模型 默认情况下 所有文件操作都是阻塞的 比如I O
  • 输入IP使用JDBC读取数据库信息并返回具体地址

    思路分析 定义连接类 连接数据库 定义properties 存放mysql信息 读取properties 注册驱动 获取连接 定义测试类 运行主程序 定义输入类 检测控制台输入 定义正则表达式 对输入的ip进行判断 判断通过则调用核心逻辑
  • SRCNN以DIV2K数据集进行训练时,.h5文件、PSNR评价指标、运行结果

    由于是从Word文档直接复制过来 其中格式如果乱码或者不通顺 请评论区告知我 1 对于 h5文件的大小计算 输入图片后 由于大小不同 无法从图片直接计算 但整合后数组有两个 一个arrlabel 一个arrdata 1 其中 arrlabe
  • 【高危】 Zoom Desktop Client for Windows <5.14.5 权限升级漏洞

    漏洞描述 Zoom 是一种用于视频会议 在线会议和远程协作的软件平台 Zoom Desktop Client for Windows 5 14 5 之前版本由于对数据的真实性验证不足 经过身份验证的攻击者可通过网络访将权限升级为 SYSTE
  • 超分辨率学习记录

    超分辨率学习记录 超分定义 经典模型 前上采样 SRCNN 后上采样 FSRCNN 这篇博客主要内容来自于天池网站的超分辨率理论基础 同时对于其中涉及的学术名词也进行了解释 作为自己学习的记录 注 所有名词右上方带 的下面都有详细解释 博客

随机推荐

  • C++报错:The build tools for v141 (Platform Toolset = 'v141') cannot be found.

    问题内容 The build tools for v141 Platform Toolset 61 39 v141 39 cannot be found To build using the v141 build tools please
  • centos7+mysql5.7安装

    1 在官方网站下载linux版本的mysql xff0c 网址 xff1a https dev mysql com downloads mysql 2 解压文件并存放在 usr local mysql 5 7 20 路径下 xff08 1
  • Shell编程——位置参数变量

    介绍 当我们执行一个shell脚本时 xff0c 如果希望获取到命令行的参数信息 xff0c 就可以使用到位置参数变量 比如 xff1a myshell sh 100 200 这个就是一个执行shell的命令行 xff0c 可以在myshe
  • CentOS安装python2.7

    查版本 whereis python python2 7安装 1 下载 xff1a wget https www python org ftp python 2 7 11 Python 2 7 11 tar xz wget https ww
  • 单机版Ceph环境部署,Linux平台

    Ceph已经如火如荼 xff0c 很多公司都在使用Ceph作为自己的存储系统 日常学习不太可能安装一个Ceph集群 xff0c 因此本文介绍如何部署一个单节点的Ceph系统 另外 xff0c 本文安装的后端存储引擎是BlueStore xf
  • Ubuntu 升级 Python3.10

    参考文档 Upgrade Python to latest version 3 10 on Ubuntu Linux
  • 2022免费国内天气查询接口

    一个可以根据IP地址或者城市名称查询天气的免费接口 xff0c 支持国内3400 43 个城市天气 请求地址 GET https api itapi cn api tianqi 请求参数 参数名参数说明key用户请求密钥 xff0c 可在
  • PHP远程文件包含(RFI)并绕过远程URL包含限制

    文章来源 xff5c MS08067 公众号粉丝投稿 本文作者 xff1a VastSky xff08 Ms08067实验室粉丝 xff09 前言 本文我们讲如何绕过远程URL包含限制 在PHP开发环境php ini配置文里 allow u
  • 内网渗透 | 最全的内网凭据密码收集方法和技巧总结

    内网凭据密码收集指南 原创投稿作者 xff1a 深蓝实验室天威战队 前言 在攻防场景下 xff0c 红队人员拿下一台终端或服务器后 xff0c 第一步要做的往往就是信息收集 xff0c 为最大化利用权限 xff0c 扩大战果 xff0c 密
  • vi 命令

    最近面试有问常用操作 虽然修改用的还蛮多的 xff0c 但有的还确实不知道 xff01 在这里记录下 xff1a vi编辑器的三种模式 1 命令模式 xff08 command mode xff09 执行命令 在该模式中 xff0c 可以输
  • ubuntu下给code-server配置https

    下载mkcert wget wget https github com FiloSottile mkcert releases download v1 4 4 mkcert v1 4 4 linux amd64 将下载好的mkcert移动到
  • 【算法】选择排序法

    一 介绍 1 选择排序法是将序列分为两段 xff0c 有序前列和无序后列 xff0c 每次查找无序后列中最大元素 xff0c 将其插入到有序前列的最末尾处 xff0c 直至无序后列最后一个元素 xff0c 最终排序后的序列为降序序列 2 适
  • VMware WorkStation的三种网络连接方式

    版权声明 xff1a 对于本博客所有原创文章 xff0c 允许个人 教育和非商业目的使用 xff0c 但务必保证文章的完整性且不作任何修改地以超链接形式注明原始作者 出处及本声明 博客地址 xff1a http blog csdn net
  • lz4压缩格式-block

    概述 lz4属于lz77系列的压缩算法 xff0c lz77系列压缩算法将重复的字符串 xff08 也称为匹配 xff09 表示成 xff08 offset match length xff09 来对数据进行压缩 lz77算法只是一种思想
  • lz4算法实现

    概述 lz4算法是lz77算法的一种实现 xff0c 就是查找重复的字符串 xff0c 重复的字符串使用 距离 长度 来表示 比如abcdefgabcdefg xff0c 被压缩后就表示成了 xff1a abcdefg xff0c 1 7
  • 光传输-政企OTN技术总结

    政企高质量专线承载网 xff08 OTN xff09 维护承接 政企OTN xff1a 政企高质量专线承载网络 xff1b 目的是为了支持政企专线和云网融合业务的发展 xff0c 提高竞争力 政企OTN的特点 端到端 xff1a 用户接入设
  • Windows安装Anaconda,conda显示不是内部命令或者外部命令,路径加上反斜杠解决

    Windows安装Anaconda conda显示不是内部命令或者外部命令 提示 xff1a 这里可以添加系列文章的所有文章的目录 xff0c 目录需要自己手动添加 这个问题是故事的开始 xff0c 由于电脑是win10 1050ti的 x
  • debian6对罗技摄像头C270——音视频采集

    0 debian6对罗技C270无驱摄像头 带MIC 的支持 0 1视频 0 1 1设备节点 dev video0 0 1 2驱动框架 V2L或V4L2 0 2音频 0 2 0准备工具 gome volume control xff1a g
  • AAC编码

    AAC编码 本篇使用的FFMPEG需要按照WIN下编译FFMPEG 基本要求 fdk aac对PCM文件有参数要求 采样格式 必须是16位整数的PCM 采样率 支持的采样率有 xff08 Hz xff09 xff1a 8000 11025
  • 【超分辨率】Zoom to Learn, Learn to Zoom

    前几天陈启峰大佬在我司内部分享几篇关于图像增强的文章 其中就有这篇 这篇文章是超分辨率落地的一个比较重要的文章 xff0c 跟以往自己去做高 低分辨率数据集不同 xff0c 本文采取了单反直接去制作数据集 xff0c 在真实场景上效果非常好