Feedback Network for Image Super-Resolution(SRFBN)---翻译

2023-05-16

attention :只详细翻译了重点部分

摘要
图像超分辨率(SR)的最新进展展现了深度学习的力量,可以实现更好的重建性能。然而,现有的基于深度学习的图像SR方法尚未充分利用人类视觉系统中常见的反馈机制。在本文中,我们提出了一个图像超分辨率反馈网络(SRFBN)来改进具有高级信息的低级表示。具体而言,我们在具有约束的RNN中使用隐藏状态来实现这种反馈方式。反馈模块旨在处理反馈连接并生成强大的高级表示。所提出的SRFBN具有强大的早期重建能力,可以逐步创建最终的高分辨率图像。此外,我们引入了curriculum learning 策略,使网络非常适合于更复杂的任务,其中低分辨率图像被多种类型的降级破坏。广泛的实验结果证明了与现有技术方法相比,所提出的SRFBN的优越性。

1.介绍
随着网络的深度增加,参数的数量也会增加。大容量网络将占用大量存储资源并遭受过度拟合问题。
为了减少网络参数,通常采用循环结构。 最近的研究[22,10]表明,许多具有重复结构的网络(例如DRCN [19]和DRRN [31])可以外推为单状态逆流神经网络(RNN)。与大多数传统的基于深度学习的方法类似,具有重复结构的这些网络可以以前馈方式共享信息。然而,前馈方式使得先前的层不可能从以下层访问有用信息,即使采用跳过连接也是如此。
在认知理论中,连接皮层视觉区域的反馈连接可以将响应信号从高阶区域传输到低阶区域[17,19]。受此现象的推动,最近的研究[30,40]将反馈机制应用于网络架构。这些体系结构中的反馈机制以自上而下的方式工作,将高级信息传回到先前的层并改进低级编码信息。
在本文中,我们提出了一种新的图像SR网络,即超分辨率反馈网络(SRFBN),以便通过反馈连接使用高级信息来改进低级信息。 所提出的SRFBN本质上是具有反馈块(FB)的RNN,其专门用于图像SR任务。FB由多组上下采样层构成,具有密集跳过连接,可生成强大的高级表示。受[40]的启发,我们使用FB的输出,即展开的RNN中的隐藏状态,以实现反馈方式(见图1(a))。每次迭代的隐藏状态流入下一次迭代以调制输入。为了确保隐藏状态包含HR图像的信息,我们将损失连接到训练过程中的每次迭代。我们的反馈方案的原理是粗略SR图像的信息可以促进LR图像重建更好的SR图像(参见图1(b))。此外,我们为案例设计了一个课程,其中LR图像由复杂的退化模型生成。对于每个LR图像,其基于恢复难度的连续迭代的目标HR图像从易到难排列。这种课程学习策略很好地帮助我们提出的SRFBN处理复杂的退化模型。实验结果证明了我们提出的SRFBN与其他最先进方法的优越性。

在这里插入图片描述
总之,我们的主要贡献如下:

  1. 提出采用反馈机制的图像超分辨率反馈网络(SRFBN)。 通过反馈连接在自上而下的反馈流中提供高级信息。 同时,这种具有反馈连接的循环结构提供了强大的早期重建能力,并且仅需要很少的参数。
  2. 提出反馈块(FB),它不仅可以有效地处理反馈信息流,还可以通过上采样层和下采样层以及密集跳过连接来丰富高级表示。
  3. 为SRFBN提出curriculum -based训练策略,其中将具有增加的重建难度的HR图像作为连续迭代的目标馈入网络。 该策略使网络能够逐步学习复杂的退化模型,而对于那些只有一步预测的方法,同样的策略是不可能的。

2.相关工作
2.1基于深度学习的SR

2.2反馈机制
反馈机制允许网络携带输出概念以纠正先前的状态。最近,许多网络架构已经采用反馈机制来完成各种视觉任务[5,4,40,11,10,28]。对于图像SR,一些研究也显示了引入反馈机制的努力。基于反投影,Haris等 [11]设计了上升和下降投影单元,以实现迭代误差反馈。Han等人 [10]应用了延迟反馈机制,该机制在双态RNN中的两个重复状态之间传输信息。然而,与我们的网络架构不同,从LR图像到最终SR图像的信息流仍然是前馈的。
我们最相关的工作是[40],它将具有高级信息的隐藏状态转移到输入图像的信息,以实现卷积递归神经网络中的反馈。然而,它旨在解决高级视觉任务,例如,分类。为了在图像SR中拟合反馈机制,我们精心设计了反馈块(FB)作为SRFBN中的基本模块,而不是像[40]中那样使用ConvLSTM。我们FB中的信息通过密集跳过连接有效地跨层级层流动。实验结果表明, 我们的FB具有优于ConvLSTM1的重建性能,因此更适合于图像SR任务。

2.3curriculum learning
Curriculum learning [2]逐渐增加了学习目标的难度,众所周知,这是改进训练程序的有效策略。早期的课程学习工作主要集中在一项任务上。 Pentina等 [27]以连续的方式将课程学习扩展到多个任务。高等人 [8]利用课程学习解决图像恢复中的固定问题。由于他们的网络仅限于一次性预测,他们通过在训练过程中随着时代的增加而提供任务复杂性的不同训练数据来强制执行课程。在图像SR的背景下,Wang等人[38]设计了金字塔结构的课程,在以前训练过的网络中逐渐融合金字塔的新层次,将LR图像升级到更大的尺寸。
虽然之前的工作主要集中在单个degradation(劣化)过程,但我们对案例强制执行curriculum ,其中LR图像被多种类型的劣化所破坏。包含易于做出决策的curriculum可以针对一个问题进行解决,以逐步恢复损坏的LR图像。

3.feedback network for image SR
反馈系统包含两个要求:(1)迭代性和(2)改变系统的输出以更正每个循环中的输入。这种迭代因果过程有助于实现我们的图像SR反馈方案的原理:高级信息可以引导LR图像以恢复更好的SR图像(参见图1(b))。
在所提出的网络中,实施我们的反馈方案有三个必不可少的部分:
(1)在每次迭代时绑定损失(迫使网络在每次迭代时重建SR图像,从而允许隐藏状态携带高级信息的概念)
(2)使用循环结构(实现迭代过程)
(3)在每次迭代时提供LR输入(以确保低级信息的可用性,这是需要被精炼的)。
如果缺少这三个部分,网络将无法推动反馈流程。

3.1网络结构
在这里插入图片描述
在这里插入图片描述

3.2. Feedback block
在这里插入图片描述
在这里插入图片描述
3.4. Implementation details在这里插入图片描述
4.实验结果
4.1 settings

Datasets and metrics
Training dataset: DIV2K and Flickr2K, make data augmentation
Metrics: PSNR, SSIM
定量结果分析:仅在Y通道上
退化(degradation)方法:bicubic(BI)下采样。为证明我们curriculum learning的有效性,我们另外实验了加了两种退化模型,在4.4和4.5.3中。
BD:加了高斯blur的下采样。设置为7x7的gaussian kernel with standard deviation 1.6 for blurring.
DN:伴随着noise level为30的adding gaussian noise 的bicubic下采样
训练相关设置:batch size为16,为充分利用LR图像上下文信息,我们根据提升因子给出不同大小的RGB patch。输入patch大小设置在表1中给出。使用【12】的方法初始化网络参数,采用ADAM优化器,初始学习率为0.0001.每200个epoch学习率乘以0.5。在pytorch中,用1080Ti GPU训练网络。
在这里插入图片描述
4.2 study of T and G
在这一小节中,我们探讨了迭代次数(表示为T)和反馈块中投影组的数目(表示为G)的影响。在随后的实验中,滤波器的基数m被设置为32。我们首先通过将G固定到6来研究T的影响。可以从图4(A)中观察到,在反馈连接的帮助下,与无反馈连接的网络(T=1)相比,重建性能明显提高。此外,随着T的不断增加,重建质量也在不断提高。换句话说,我们的反馈块肯定有利于跨时间的信息流。然后,我们通过将T固定到4来研究G的影响。图4(B)示出更大的G由于更深的网络的更强的代表能力而导致更高的精确度。总之,选择更大的T或G都有助于取得更好的结果。值得注意的是,小T和G仍然优于VDSR[18]。在下面的讨论中,我们使用SRFBN-L(T=4,G=6)进行分析。
在这里插入图片描述
实验结果比较
在这里插入图片描述
5. 结论
本文提出了一种新的图像SR网络-超分辨率反馈网络(SRFBN),通过增强高层次的图像表示来忠实地重建SR图像。网络中的反馈块(FB)可以有效地处理反馈信息流和特征重用。此外,还提出了一种curriculum学习策略,使网络能够很好地适应复杂退化模型破坏低分辨率图像的复杂任务。综合实验结果表明,所提出的SRFBN能以极小的参数提供与现有方法相比的比较或更好的性能。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Feedback Network for Image Super-Resolution(SRFBN)---翻译 的相关文章

  • 使用 Laravel Intervention 库缓存动态图像不起作用

    我目前正在使用 Laravel 5 并利用干预图像集成 http image intervention io http image intervention io 我动态地使用它 因此图像具有如下 URL http example org
  • 如何在后台加载图像?

    问题 我正在创建一个专辑 所以每次按 时间 下一个 按钮我正在加载新图像 我想要实现的是 只有在新图像从服务器完全下载后 我才想从旧图像切换到新图像 实际上我不想在加载时显示部分图像 有什么解决办法吗 PS 类似的问题 https stac
  • 使用 /CCITTFaxDecode 过滤器从 PDF 中提取图像

    我有一个通过扫描软件生成的 pdf 文件 该 pdf 每页有 1 个 TIFF 图像 我想从每个页面中提取 TIFF 图像 我正在使用 iTextSharp 我已经成功找到了图像 并且可以从PdfReader GetStreamBytesR
  • 在本地 UIWebView 中使用 Retina 图像

    由于某种原因 我无法让 UIWebView 与我的新 Retina 图像 很好地配合 问题 一步一步 我正在从捆绑包中加载一系列 HTML 帮助文件 如果是 iPhone 4 我的代码会加载不同的 HTML 文件 LWERetinaUtil
  • 如何缩小 BufferedImage 的大小和质量?

    我正在开发一个项目 一个名为 远程桌面控制 的客户端服务器应用程序 我需要做的是获取客户端计算机的屏幕截图并将该屏幕截图发送到服务器计算机 我可能需要每秒发送 3 到 5 张图像 但考虑到发送BufferedImage直接的过程成本太高 我
  • 如何在Android中没有Intent且没有任何视图窗口的情况下拍照

    大家好 我正在尝试弄清楚如何通过按下按钮来拍照 而不显示任何预览 我的想法是 我想要拍摄并保存照片 但之前或之后没有照片的视觉预览 到目前为止 我能够获取拍照并将其保存到磁盘的代码 没有任何问题 但如果没有表面视图或预览 我似乎无法做到这一
  • 使用 CSS3 在屏幕上移动图像

    我浏览网页已经有一段时间了 试图找到一种方法 让图标在加载页面时移动到屏幕上 从左侧移动到 body div 的中心 如何才能做到这一点 这是我到目前为止所拥有的 CSS3 a rotator text decoration none pa
  • “imagecolorat”和透明度

    如何才能获得透明度上一个像素的值image imagecolorat 仅选取图像中指定位置的像素颜色索引 通过该索引 我可以获取 RGB 值 但不能获取透明值 希望您理解 并提前感谢您 解决方案可能如下 colorIndex imageco
  • 如何从本地计算机或网络资源在 Jupyter Notebook 中嵌入图像或图片?

    我想将图像包含在 jupyter 笔记本中 如果我执行以下操作 它会起作用 from IPython display import Image Image img picture png 但我想将图像包含在 markdown 单元格中 并且
  • Go 中的 WebP 编码器/解码器

    是否有一个完整的 WebP 编码器和解码器与当前每周 或可分叉 兼容 它的速度与标准 png 相当吗 这个人在 GitHub 上有一个包 其中包含 WebP 的编码器和解码器 https github com chai2010 webp h
  • 如何在android中使用parse api在parse服务器中上传图像

    我想在android中的解析云服务器中上传图像 但我无法这样做 我尝试过以下代码 Drawable drawable getResources getDrawable R drawable profilepic Bitmap bitmap
  • 在上传过程中调整网页中的图像大小和优化图像的最佳类是什么?

    我正在寻找一个类 使用 C 来检查我的图像尺寸 宽度和高度 或以 kb 为单位的图像尺寸 如果它们与我最喜欢的尺寸不匹配 请调整它们的大小 意味着使用 Constrain 和相对宽度和高度 new大小就像 Photoshop 中的图像大小
  • 使用 OpenCV 和 Python 叠加两个图像而不丢失颜色强度

    如何叠加两个图像而不损失两个图像的颜色强度 我有图像1和图像2 2 我尝试使用 0 5 alpha 和 beta 但它给我的合并图像的颜色强度只有一半 dst cv2 addWeighted img1 0 5 img2 0 5 0 但是当我
  • 无需画布,用纯 JS 生成图像

    如何在没有画布的情况下用纯 JavaScript 无外部库 从像素数组生成 绘制图片 我尝试以URI形式生成图像但没有成功 图片格式不容易快速理解和实现 BMP 数据URI 您可以使用以下函数生成 BMP 位图 dataURI 24 位的
  • CoreData:是否将图像存储到数据库?

    我正在制作一个应用程序 它从网站上为某些用户名拍摄照片 并将其显示在带有用户名的 UITable 中 然后当单击用户名时 它会显示该用户的照片 然后单击照片名称 它会显示全屏照片 我的问题是我正在使用 NSData 从互联网获取照片 我必须
  • 减少非常大图像的文件大小,而不改变图像尺寸

    考虑一个处理可能非常大的 PNG 文件上传的应用程序 所有上传的文件必须存储到磁盘以供以后检索 但是 PNG 文件的大小最大可达 30 MB 但磁盘存储限制规定每个文件的最大大小为 1 MB 问题是获取文件大小高达 30 MB 的输入 PN
  • PHP - 获取base64图像字符串解码并保存为jpg(生成空图像)

    嗨 我实际上是通过 ajax 发送一个 base64 图像字符串到一个 php 脚本 该脚本只是解码字符串并将内容保存为 jpg 文件 但结果是一张空图像 这怎么可能 PHP脚本 uploadedPhotos array photo 1 p
  • 图像随机损坏(但刷新后加载)并显示“资源解释为图像但使用 MIME 类型 text/html 传输”

    我目前正在开发一个简单的 php 网站 问题是 我的整个网站中的图像 发生在所有 php 文件中 随机损坏并显示错误资源解释为图像 但以 MIME 类型 text html 传输但是 如果我尝试多次刷新页面 可以再次加载图像并且错误消失 我
  • flutter应用程序中有图像编辑器的api吗?我需要在图像中添加文本

    是否可以编辑图像 例如旋转以及在图像上添加文本 有没有什么插件可以做到这一点 我需要一个图像编辑器来添加具有各种字体和颜色的文本 谢谢 你应该使用重画边界 https docs flutter io flutter widgets Repa
  • Java 旋转图像

    Override public void paintComponent Graphics g super paintComponent g Graphics2D g2 Graphics2D g create rotation of play

随机推荐

  • C++20新特性个人总结

    目录 1 关键字 1 1 concept 1 2 requires 1 3 typename 1 4 explicit 1 5 constexpr 1 6 char8 t 1 7 consteval 1 8 co await co yiel
  • MySQL | MySQL为什么建议不要使用视图

    MySQL为什么建议不要使用视图 一 什么是视图二 为什么不建议使用视图 一 什么是视图 官方定义 xff1a 视图是指计算机数据库中的视图 xff0c 是一个虚拟表 xff0c 其内容由查询定义 同真实的表一样 xff0c 视图包含一系列
  • 【数据标准】学院数据集标准规范-1.6-元数据XML

    XML概述 XML 基础教育教学资源元数据的数据模型定义了一个层次结构的概念模型 xff0c 层次结构的模型可以方便地表示包含许多元素和子元素的数据 XML非常适合表示层次结构的模型 XML文档就是层次结构的 xff0c 它由元素组成 xf
  • Python-音频处理之wav文件与十进制pcm文件的相互转换

    一 pcm转wav 1 pcm文件以十进制的格式保存 xff0c 因此读取pcm的txt文件时不用 rb 来读取 2 适用于写单通道wav文件 xff0c 多通道需要对数据进行reshape操作 import wave import str
  • webapp打包为Android的apk包的一种方法

    开发了个纯web的app小demo 想着最终集成到微信公众号上做个小功能 xff0c 并测试下如何跨平台的运行在Android上 关于如何打包为Android的安装包 xff0c 总结了下其中的一种方法 xff0c 使用cordova打包为
  • 滤波算法(二)—— 中位值滤波算法

    1 算法介绍 中位值滤波算法的实现方法是采集N个周期的数据 xff0c 去掉N个周期数据中的最大值和最小值 xff0c 取剩下的数据的平均值 中位值滤波算法特别适用于会偶然出现异常值的系统 中位值滤波算法应用比较广泛 xff0c 比如用于一
  • C++可变参数使用总结

    可变参数是指函数可以接受不定数量的参数 比如在printf函数 xff0c 如果做日志等功能也会用到 这里总结下可变参数的使用 c语言中的可变参数 先介绍下在c语言中的使用 xff0c c语言也支持可变参数 xff0c 只是需要借助下va
  • 替代notepad++,notepad--介绍及插件cmake编译

    Notepad 43 43 是一个文本编辑器小软件 xff0c 用来替代windows自带的记事本 然而Notepad 43 43 软件的作者太霸道 xff0c 如果你不赞同他的观点 xff0c Notepad 43 43 将会在你的源码里
  • [环境搭建] onlyoffice环境搭建(docker-compose)

    只介绍环境搭建 不介绍集成 一 环境要求 内核 xff1a Linux 操作系统 xff1a centos 或者 ubuntu 容器环境 xff1a docker 容器镜像 xff1a onlyoffice documentserver 二
  • WSL:系统迁移【WSL默认安装在C盘,可以将虚拟机移到任意位置】

    因为虚拟机 xff08 Ubuntu22 04 xff09 默认安装在C盘 xff0c 大量占用系统盘的空间 xff0c 所以迁移到其他盘中 查看安装的虚拟机 wsl l v 关闭所有正在运行的虚拟机 wsl shutdown 对需要迁移的
  • Microsoft 365 Copilot怎么安装,如何下载?

    Microsoft 365 Copilot是一款基于人工智能的数字助手 xff0c 旨在帮助Microsoft 365商业版的用户更轻松地管理其工作流程 它可以提供实时反馈 自动生成报告 优化时间表以及自动化办公任务等功能 xff0c 这些
  • 关于Sublime Text4 _4126

    目录 前言 一 下载安装 下载安装 二 汉化 Install PackageChineseLocalzations 三 激活 进入hexed网站编辑编辑改码另存为 四 运行 successfully 总结 前言 怕以后忘了 xff0c 上操
  • CSDN编写技巧--CSDN中高亮显示代码

    介绍一种好的格式如下 xff1a 实现的方法就是以原代码的形式显示页面 xff0c 然后复制以下代码 xff1a lt div style 61 34 BORDER BOTTOM cccccc 1px dashed BORDER LEFT
  • 去掉jOSN中的转义符

    json返回全都是带 39 39 的 于是要去掉这个反斜杠 但是OC里面的 39 39 是转义符 不能直接用 64 34 34 之类的表示 一顿搜索之后 找到了OC对转义字符的表示方法 如下 a Sound alert b 退格 f For
  • 微软 Win11 一个命令安装 Windows Linux 子系统(WSL)

    在最新的 Windows 11操作系统中 xff0c 你只需运行 wsl exe install 就可以安装运行 WSL 所需的一切 使用 wsl install 微软表示 xff0c 以前设置 WSL 的过程过于复杂 xff0c 涉及到开
  • linux服务器xrdp远程链接密码对了却password failed解决方法

    linux服务器xrdp远程链接密码对了却password failed解决方法 遇到问题问题定位解决参考链接 遇到问题 在win10下用自带的远程连接登陆服务器 xff0c 明明密码对了 xff0c 却无法登陆 xff0c 显示 pass
  • 滤波算法(四)—— 卡尔曼滤波算法

    一 算法介绍 卡尔曼滤波是一个神奇的滤波算法 xff0c 应用非常广泛 xff0c 它是一种结合先验经验 测量更新的状态估计算法 1 状态估计 首先 xff0c 对于一个我们关心的物理量 xff0c 我们假设它符合下面的规律 其中 xff0
  • selenium-Firefox浏览器驱动geckodriver的下载配置

    首先下载Firefox的驱动 xff0c 地址 xff1a geckodriver Mirror 选择最新的版本 xff0c 进入后选择对应的系统下载 xff1a 将下载下来的文件放入到自己python的安装目录中的Scripts文件夹中即
  • 行人检测之HOG——方向梯度直方图(Histogram of Oriented Gradient)

    写在前面的话 HOG 绝对说的是行人检测领域的一个标志性的里程碑 xff0c 虽然 2008 年出现的 DPM DeformablePart Model 方法取得了更好的检测效果 xff0c 但是实时性实在堪忧 xff0c 就算用多线程实现
  • Feedback Network for Image Super-Resolution(SRFBN)---翻译

    attention xff1a 只详细翻译了重点部分 摘要 图像超分辨率 xff08 SR xff09 的最新进展展现了深度学习的力量 xff0c 可以实现更好的重建性能 然而 xff0c 现有的基于深度学习的图像SR方法尚未充分利用人类视