论文阅读:CVPR2022 Wavelet Knowledge Distillation: Towards Efficient Image-to-Image Translation

2023-11-06

任务:图像转换

背景分析:

生成对抗网络(GAN)在图像到图像的翻译中取得了显著成就。然而,由于参数量巨大,最先进的 GAN 通常存在效率低和内存使用量大的问题。

为了应对这一挑战,本文首先从频率的角度研究了 GAN 的性能。结果表明,尤其是小型 GAN,缺乏生成高质量高频信息的能力。

为了解决这个问题,提出了一种新的知识蒸馏方法,称为小波知识蒸馏。小波知识蒸馏不是直接提取生成的教师图像,而是首先通过离散小波变换将图像分解为不同的频带,然后仅提取高频带。

因此,学生 GAN 可以更加关注其在高频上的学习。实验表明,在 CycleGAN 上实现了 7.08 倍的压缩和 6.80 倍的加速,几乎没有性能下降。此外,我们研究了鉴别器和生成器之间的关系,这表明鉴别器的压缩可以提高压缩生成器的性能。

Introduction:

知识蒸馏很适合小模型提高性能,但其不适合GAN。用于将生成的图像和地面实况图像分解为不同的频带。 然后,我们分别计算每个频带上的归一化 L1-范数距离。所有 GAN 在低频段实现了非常低的误差,但在高频段生成失败,这与 GAN 生成的图像没有很好的细节的观察结果一致。 此外,可以观察到,与大型 GAN 相比,微型 GAN 在低频段的性能相当,但在高频段的性能要差得多。 这两个观察结果表明,在 GAN 压缩过程中应该更多地关注高频。

文章主要工作:

1)从频率角度分析了 GAN 的性能,定量地表明 GAN,尤其是小型 GAN 缺乏在图像中生成高质量高频信息的能力。基于上述观察,小波知识蒸馏被提出来解决这个问题,只提取高频信息,而不是从教师生成的图像中提取所有信息。

2)三个模型和八个数据集以及六种比较方法的定量和定性结果证明了方法的有效性。

3)研究了模型压缩过程中判别器和生成器之间的关系。它表明,对判别器的压缩对于在对抗性学习中保持与压缩生成器的竞争是必要的。

Method: 无代码

回顾小波变换:

 

 回顾蒸馏算法:

 

小波知识蒸馏:

 

一些回顾:

关于频域与CNN结合的相关研究:

Multi-Level Wavelet Convolutional Neural Networks -IEEE access 2019

图像重建任务、类似U-Net但是不包含上下采样、用DWT和IDWT替换。

FcaNet: Frequency Channel Attention Networks -arxiv2020

利用频域分析,改进通道自注意力。

提出并证明GAP是一种特殊形式的2D DCT(离散余弦变换),结果是低频的2D DCT成分。

提出多频域通道自注意力。

Invertible Image Rescaling--ECCV2020

任务:图像缩放➕还原

可逆网络+保留高频信息

但实际无法在存储、传输低分辨率图片时还附带本应被丢失的高频信息

分析:每次小波变换,h+取决于样本(case-specific),且和ll相关。条件概率分布p(h+|ll)难以获得。利用INN把条件概率分布转换为独立分布(case-agnoistic)。

重建图像通过在正态分布中随机选点,经过INN得到原被丢弃的信息。

但整个过程并不是完全没有信息丢失,比起先前研究中忽视ill-posed问题的做法,本文从本质上缓解求解ill-posed问题带来的困难。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

论文阅读:CVPR2022 Wavelet Knowledge Distillation: Towards Efficient Image-to-Image Translation 的相关文章

  • 关于AJAX请求服务器后缓存数据,造成没有及时刷新的问题

    最近在做项目的时候 使用了ajax去请求服务器的数据 刚开始还可以 我测试一切运行正常 我不是专业的测试人员哈 所以还是有些问题没有测出来哈 后来ajax请求的数据变化了 但是页面数据没有变 依然是第一次的数据 这个问题害我整了好大半天啊

随机推荐

  • My Fifteenth Page - 快乐数 - By Nicolas

    今天小尼写的这篇page针对的是leetcode上的202 快乐数所写的 首先小尼先简单介绍一下这道题 就是给定一正整数 然后每一次将该数的每一位都平方再相加得到一个新的数据 我们不断的反腐操作 最后如果这个数经过多次操作后返回到了原来的这
  • 戴尔笔记本开机logo进度条时间长的解决办法

    戴尔笔记本开机 出现进度条 需要等30s才出现系统界面 这种问题的一个原因是 BOOT List option 选项选了UEFI 将此选项设置为Legacy 进度条瞬间几秒钟跳过 亲测有效 系统是win10
  • 静态分析领域中弱点、不足、缺陷、故障等概念之间的关系

    在CWE范畴内 讨论的核心内容是 弱点 及 不足 而在软件静态分析范畴内 研究的核心内容是 缺陷 及 故障 CWE已经越来越多的被静态分析用于重要参照标准 因此有必要将这几个关键概念之间的关系梳理清楚 弱点 Weakness 定义 CWE中
  • 完美解决 Treating Unicode character as whitespace的问题

    在我们 copy 一些文本到 Xcode 里面的时候会有 Treating Unicode character as whitespace 的警告 此时认真检查你 copy 的文本部分 回车 空格是否有问题 当然一般检查不出来 如果 直接删
  • 概率论【合集】--猴博士爱讲课

    重点章节 条件概率 期望等等 第一课 随机事件和概率 1 6 无放回类题目 一次摸多个 例 1 盒子里有 3 绿 4 红共
  • 外网访问内网机器中的VMware虚拟机服务问题排查

    场景 家里的电脑 win10 搭了个开发环境 并安装了VMware的linux虚拟机 在虚拟机中通过docker部署了几个服务 希望能在公司访问家里的服务器 问题 内网访问虚拟机服务成功 外网访问失败 vm虚拟机通过桥接连接外网 固定ip
  • jQuery基本介绍和 DOM 对象互相转换

    文章目录 jQuery基本介绍和 DOM 对象互相转换 基本介绍 jQuery 的原理示意图 JQuery 基本开发步骤 说明 jQuery简单示例 jQuery 对象和 DOM 对象 什么是 jQuery 对象 DOM 对象转成 jQue
  • android 后台服务长时间运行---解决方案

    android 后台服务启动方式 第一种 Activity界面通过Intent启动相关service 等价于 Timer定时器 TimerTask定时任务 第二种 Activity界面通过发生广播启动相关service 等价于 AlarmM
  • java 数据脱敏工具类

    import org apache commons lang3 StringUtils p 脱敏工具 p author ocean version 1 0 0 date 2023 5 4 14 51 public class Encrypt
  • 灰灰-309-射击比赛

    本题目给出的射击比赛的规则非常简单 谁打的弹洞距离靶心最近 谁就是冠军 谁差得最远 谁就是菜鸟 本题给出一系列弹洞的平面坐标 x y 请你编写程序找出冠军和菜鸟 我们假设靶心在原点 0 0 输入格式 输入在第一行中给出一个正整数 N 10
  • Redis 7 第六讲 主从模式(replica)架构篇

    此篇开始进入架构篇范围 艸 理论 即主从复制 master以写为主 Slave以读为主 当master数据变化的时候 自动将新的数据异步同步到其它slave数据库 使用场景 读写分离 容灾备份 数据备份 水平扩容 主从架构 演示案例 注 m
  • C# websocket的使用

    实现背景 有两个设备 A跟B两个冰箱 两者都装有app 现在需要在A上面控制B进行开门 A需要调用服务器接口 然后服务器发送消息控制B开门 此处记录下服务器端实现过程 1 包使用的Fleck 直接去nuget里下载安装即可 2 这一步可忽略
  • 用命令修改宝塔面板修改默认端口

    大家好 我是胸怀像 欢迎关注微信公众号 雄雄的小课堂 前言 下面我们来让incode ai来介绍一下宝塔面板 如下所示 宝塔面板是一款运行在 Linux 操作系统上的免费管理面板 它可以提供给用户如网站部署 数据库管理 文件管理 SSL 证
  • SpringMVC接收复杂参数

    SpringMVC接收复杂参数 1 前言 以前后端这边接收的参数都是比较简单的 直接使用 RequestParam或者 PathVariable在或者用一个对象就可以接收到了 但是最近突然遇到了前端需要传递很复杂数据的情况 以前没有想到过的
  • Linux 安装 redis6.0.8,make 时报错 make[1]: *** [server.o] Error 1 的解决方法

    原因是因为 gcc 版本过低 yum 安装的 gcc 是 4 8 5 的 需要升级 gcc 升级过程如下 yum y install centos release scl yum y install devtoolset 9 gcc dev
  • 虚拟机比较: Multipass,VirtualBox,qemu

    目录 官网 https multipass run install 参考 https zhuanlan zhihu com p 453901901 https www cnblogs com satire p 15681820 html 问
  • 解决Python报错:PermissionError: [Errno 13] Permission denied

    这个错误是因为文件不存在或者文件已经被打开了 导致python没有权限去读写它 建议 先去检查文件是否存在 检查这个文件有没有打开 如果被打开的话 那么python是没有权限对它进行读写的 注意的是 有一些c盘的文件需要管理员授权 当然这个
  • LabVIEW串口通信实际操作

    理论基础 LabVIEW串口通信基础知识 读取串口字节 我们新建一个空白 VI 借助串口调试助手和虚拟串口 在 LabVIEW 中编写的一个最简单的例子 写一个基本的读取串口字节的程序 在程序框图中编程如下 注意这里 串口配置放到循环外 不
  • SpringBoot在静态方法或工具类中注入Bean及配置参数

    场景一 静态方法或工具类中注入Bean 示例 author version 1 0 description 通用工具类型 date 2022 5 22 19 36 public class CommonUtil Autowired priv
  • 论文阅读:CVPR2022 Wavelet Knowledge Distillation: Towards Efficient Image-to-Image Translation

    任务 图像转换 背景分析 生成对抗网络 GAN 在图像到图像的翻译中取得了显著成就 然而 由于参数量巨大 最先进的 GAN 通常存在效率低和内存使用量大的问题 为了应对这一挑战 本文首先从频率的角度研究了 GAN 的性能 结果表明 尤其是小