论文阅读：CVPR2022 Wavelet Knowledge Distillation: Towards Efficient Image-to-Image Translation

2023-11-06

任务：图像转换

背景分析：

生成对抗网络（GAN）在图像到图像的翻译中取得了显著成就。然而，由于参数量巨大，最先进的 GAN 通常存在效率低和内存使用量大的问题。

为了应对这一挑战，本文首先从频率的角度研究了 GAN 的性能。结果表明，尤其是小型 GAN，缺乏生成高质量高频信息的能力。

为了解决这个问题，提出了一种新的知识蒸馏方法，称为小波知识蒸馏。小波知识蒸馏不是直接提取生成的教师图像，而是首先通过离散小波变换将图像分解为不同的频带，然后仅提取高频带。

因此，学生 GAN 可以更加关注其在高频上的学习。实验表明，在 CycleGAN 上实现了 7.08 倍的压缩和 6.80 倍的加速，几乎没有性能下降。此外，我们研究了鉴别器和生成器之间的关系，这表明鉴别器的压缩可以提高压缩生成器的性能。

Introduction：

知识蒸馏很适合小模型提高性能，但其不适合GAN。用于将生成的图像和地面实况图像分解为不同的频带。然后，我们分别计算每个频带上的归一化 L1-范数距离。所有 GAN 在低频段实现了非常低的误差，但在高频段生成失败，这与 GAN 生成的图像没有很好的细节的观察结果一致。此外，可以观察到，与大型 GAN 相比，微型 GAN 在低频段的性能相当，但在高频段的性能要差得多。这两个观察结果表明，在 GAN 压缩过程中应该更多地关注高频。

文章主要工作：

1）从频率角度分析了 GAN 的性能，定量地表明 GAN，尤其是小型 GAN 缺乏在图像中生成高质量高频信息的能力。基于上述观察，小波知识蒸馏被提出来解决这个问题，只提取高频信息，而不是从教师生成的图像中提取所有信息。

2）三个模型和八个数据集以及六种比较方法的定量和定性结果证明了方法的有效性。

3）研究了模型压缩过程中判别器和生成器之间的关系。它表明，对判别器的压缩对于在对抗性学习中保持与压缩生成器的竞争是必要的。

Method：无代码

回顾小波变换：

回顾蒸馏算法：

小波知识蒸馏：

一些回顾：

关于频域与CNN结合的相关研究：

Multi-Level Wavelet Convolutional Neural Networks -IEEE access 2019

图像重建任务、类似U-Net但是不包含上下采样、用DWT和IDWT替换。

FcaNet: Frequency Channel Attention Networks -arxiv2020

利用频域分析，改进通道自注意力。

提出并证明GAP是一种特殊形式的2D DCT（离散余弦变换），结果是低频的2D DCT成分。

提出多频域通道自注意力。

Invertible Image Rescaling--ECCV2020

任务：图像缩放➕还原

可逆网络+保留高频信息

但实际无法在存储、传输低分辨率图片时还附带本应被丢失的高频信息

分析：每次小波变换，h+取决于样本(case-specific)，且和ll相关。条件概率分布p（h+|ll）难以获得。利用INN把条件概率分布转换为独立分布(case-agnoistic)。

重建图像通过在正态分布中随机选点，经过INN得到原被丢弃的信息。

但整个过程并不是完全没有信息丢失，比起先前研究中忽视ill-posed问题的做法，本文从本质上缓解求解ill-posed问题带来的困难。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

论文阅读：CVPR2022 Wavelet Knowledge Distillation: Towards Efficient Image-to-Image Translation 的相关文章

关于AJAX请求服务器后缓存数据,造成没有及时刷新的问题

最近在做项目的时候使用了ajax去请求服务器的数据刚开始还可以我测试一切运行正常我不是专业的测试人员哈所以还是有些问题没有测出来哈后来ajax请求的数据变化了但是页面数据没有变依然是第一次的数据这个问题害我整了好大半天啊

随机推荐

My Fifteenth Page - 快乐数 - By Nicolas

今天小尼写的这篇page针对的是leetcode上的202 快乐数所写的首先小尼先简单介绍一下这道题就是给定一正整数然后每一次将该数的每一位都平方再相加得到一个新的数据我们不断的反腐操作最后如果这个数经过多次操作后返回到了原来的这
戴尔笔记本开机logo进度条时间长的解决办法

戴尔笔记本开机出现进度条需要等30s才出现系统界面这种问题的一个原因是 BOOT List option 选项选了UEFI 将此选项设置为Legacy 进度条瞬间几秒钟跳过亲测有效系统是win10
静态分析领域中弱点、不足、缺陷、故障等概念之间的关系

在CWE范畴内讨论的核心内容是弱点及不足而在软件静态分析范畴内研究的核心内容是缺陷及故障 CWE已经越来越多的被静态分析用于重要参照标准因此有必要将这几个关键概念之间的关系梳理清楚弱点 Weakness 定义 CWE中
完美解决 Treating Unicode character as whitespace的问题

在我们 copy 一些文本到 Xcode 里面的时候会有 Treating Unicode character as whitespace 的警告此时认真检查你 copy 的文本部分回车空格是否有问题当然一般检查不出来如果直接删
概率论【合集】--猴博士爱讲课

重点章节条件概率期望等等第一课随机事件和概率 1 6 无放回类题目一次摸多个例 1 盒子里有 3 绿 4 红共
外网访问内网机器中的VMware虚拟机服务问题排查

场景家里的电脑 win10 搭了个开发环境并安装了VMware的linux虚拟机在虚拟机中通过docker部署了几个服务希望能在公司访问家里的服务器问题内网访问虚拟机服务成功外网访问失败 vm虚拟机通过桥接连接外网固定ip
jQuery基本介绍和 DOM 对象互相转换

文章目录 jQuery基本介绍和 DOM 对象互相转换基本介绍 jQuery 的原理示意图 JQuery 基本开发步骤说明 jQuery简单示例 jQuery 对象和 DOM 对象什么是 jQuery 对象 DOM 对象转成 jQue
android 后台服务长时间运行---解决方案

android 后台服务启动方式第一种 Activity界面通过Intent启动相关service 等价于 Timer定时器 TimerTask定时任务第二种 Activity界面通过发生广播启动相关service 等价于 AlarmM
java 数据脱敏工具类

import org apache commons lang3 StringUtils p 脱敏工具 p author ocean version 1 0 0 date 2023 5 4 14 51 public class Encrypt
灰灰-309-射击比赛

本题目给出的射击比赛的规则非常简单谁打的弹洞距离靶心最近谁就是冠军谁差得最远谁就是菜鸟本题给出一系列弹洞的平面坐标 x y 请你编写程序找出冠军和菜鸟我们假设靶心在原点 0 0 输入格式输入在第一行中给出一个正整数 N 10
Redis 7 第六讲主从模式（replica）架构篇

此篇开始进入架构篇范围艸理论即主从复制 master以写为主 Slave以读为主当master数据变化的时候自动将新的数据异步同步到其它slave数据库使用场景读写分离容灾备份数据备份水平扩容主从架构演示案例注 m
C# websocket的使用

实现背景有两个设备 A跟B两个冰箱两者都装有app 现在需要在A上面控制B进行开门 A需要调用服务器接口然后服务器发送消息控制B开门此处记录下服务器端实现过程 1 包使用的Fleck 直接去nuget里下载安装即可 2 这一步可忽略
用命令修改宝塔面板修改默认端口

大家好我是胸怀像欢迎关注微信公众号雄雄的小课堂前言下面我们来让incode ai来介绍一下宝塔面板如下所示宝塔面板是一款运行在 Linux 操作系统上的免费管理面板它可以提供给用户如网站部署数据库管理文件管理 SSL 证
SpringMVC接收复杂参数

SpringMVC接收复杂参数 1 前言以前后端这边接收的参数都是比较简单的直接使用 RequestParam或者 PathVariable在或者用一个对象就可以接收到了但是最近突然遇到了前端需要传递很复杂数据的情况以前没有想到过的
Linux 安装 redis6.0.8，make 时报错 make[1]: *** [server.o] Error 1 的解决方法

原因是因为 gcc 版本过低 yum 安装的 gcc 是 4 8 5 的需要升级 gcc 升级过程如下 yum y install centos release scl yum y install devtoolset 9 gcc dev
虚拟机比较： Multipass，VirtualBox，qemu

目录官网 https multipass run install 参考 https zhuanlan zhihu com p 453901901 https www cnblogs com satire p 15681820 html 问
解决Python报错：PermissionError: [Errno 13] Permission denied

这个错误是因为文件不存在或者文件已经被打开了导致python没有权限去读写它建议先去检查文件是否存在检查这个文件有没有打开如果被打开的话那么python是没有权限对它进行读写的注意的是有一些c盘的文件需要管理员授权当然这个
LabVIEW串口通信实际操作

理论基础 LabVIEW串口通信基础知识读取串口字节我们新建一个空白 VI 借助串口调试助手和虚拟串口在 LabVIEW 中编写的一个最简单的例子写一个基本的读取串口字节的程序在程序框图中编程如下注意这里串口配置放到循环外不
SpringBoot在静态方法或工具类中注入Bean及配置参数

场景一静态方法或工具类中注入Bean 示例 author version 1 0 description 通用工具类型 date 2022 5 22 19 36 public class CommonUtil Autowired priv
论文阅读：CVPR2022 Wavelet Knowledge Distillation: Towards Efficient Image-to-Image Translation

任务图像转换背景分析生成对抗网络 GAN 在图像到图像的翻译中取得了显著成就然而由于参数量巨大最先进的 GAN 通常存在效率低和内存使用量大的问题为了应对这一挑战本文首先从频率的角度研究了 GAN 的性能结果表明尤其是小

论文阅读：CVPR2022 Wavelet Knowledge Distillation: Towards Efficient Image-to-Image Translation

论文阅读：CVPR2022 Wavelet Knowledge Distillation: Towards Efficient Image-to-Image Translation 的相关文章

随机推荐

热门标签