AttGAN

2023-10-29

AttGAN: Facial Attribute Editing by Only Changing What You Want

摘要

本文和以往不同之处是attribute classification constraint,用来保证在生成网络的时候,正确的属性转变。 Reconstruction learning,保证改变属性之外的其他属性正常。Adversarial learning (对抗loss)使用来进行视觉编辑。

模型架构图

 

 

本文改进点

 

本文改进点分成三个部分:

  1. 与以往基于编码与特性依赖不同,本文使用attribute classification constraint方法,来确保目标特性被编写。
  2.  配合attribute classification constraint ,对抗loss以及重构结构可以使得生成图像具有极高的质量,并且能够保证其他非编辑的属性得到保护。
  3. 本模型可以进行多脸部特征编辑,且图像的质量要优于以往模型。

 

 

AttGAN

其结构是由两个基本的子网络组成,一个是编码器Genc一个解码器Gdec,然后配合属性分类器C以及判别器D。

 

attGAN测试步骤

 

  1. 首先由一个具有n个属性的图片Xa其中a = [a1 ……. an]经过编码器后变为

  1. 如果需要将Xa的风格转化成目标特性b,那么需要这个目标特性b = [b1….bn] 然后再使用解码器即可

  1. 所以测试的总体步骤可以抽象如下

attGAN的训练步骤

根据推理过程可知我们主要的训练是针对Genc以及Gdec的,这是无监督的主要是因为我们真正需要编辑成的图片Xb是没有的。

         Attribute classifier 用于保证生成的图片Xb具有b的特征。并且adversarial learning 是保证视觉正确性。

在生成图像的时候我们也要求,在对目标属性改变的时候保留原来自有的属性,这些都是通过 reconstruction loss来实现的,这样可以使得decoder在生成图像的时候能够保留更多的原有属性。

Attribute Classification constraint

 

其中分类设置C使用网络的原始图片以及原始特性进行训练的,

Reconstruction Loss

Adversarial Loss

整体网络的训练损失为

判别器和特征分类的损失如下

里面所有的系数为超参

 

费改变特征保留

为什么能够保留住非目标特征,本文作者认为,由于重构任务以及特征编辑任务是因为他们的任务十分的相似,并且对decoder有相同的输入输出,所以在任务空间迁移的时候任务代沟不大。

特征风格生成

其他模型对于同一特征类别的多样性的生成,很难做到。比如别的模型只能生成眼镜,不能够生成是太阳镜或者近视镜等,但是本文中的模型可以通过控制器[c1………cn]将控制器与每个特征进行绑定,然后就可以通过实现控制器与生成图片的极大相关来实现,对于每个属性多类别的控制。

 

 

特征密度的控制

attgan可以直接进行特整密度的控制,我们训练的时候使用0、1二值,但是测试的时候作者发现,可以在不改变任何结构的情况下,输入连续的值,生成的图像也是自然流畅的。

多结构试验

试用 idp  cls adv rec

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

AttGAN 的相关文章

  • 硅基生命之漫谈-2:宇宙之基本法则:聚合与分解?

    聚合与分解是宇宙的基本法则 聚合是万物存在和发展的形式 是重组基本粒子的过程 分解是万物存在和死亡的形式 是回归基本粒子的过程 分解的目的是为了重组聚合 重组聚合的结果会重新分解 太极图 八卦图 人的生命体 万物的生命体 无机体 人类社会的
  • 2023.05.30-ubuntu22.04多卡服务器卸载cuda重新安装(踩坑不断版本)

    目录 说明 1 驱动问题 1 1 卸载驱动 1 2 安装驱动 2 cuda卸载 2 1 卸载用run方式安装的CUDA和驱动 2 2 卸载用deb方式安装的CUDA 3 cudn cudnn安装 3 1 cuda11 7安装 3 2 cud
  • 【PTA】L2-035 完全二叉树的层序遍历

    L2 035 完全二叉树的层序遍历 25分 一个二叉树 如果每一个层的结点数都达到最大值 则这个二叉树就是完美二叉树 对于深度为 D 的 有 N 个结点的二叉树 若其结点对应于相同深度完美二叉树的层序遍历的前 N 个结点 这样的树就是完全二
  • Android WebView 在开发过程中有哪些坑?

    https www zhihu com question 31316646 作者 李明亮 链接 https www zhihu com question 31316646 answer 52714778 来源 知乎 著作权归作者所有 转载请
  • 华为OD机试真题- 字符串重新排序【2023Q1】【JAVA、Python、C++】

    题目描述 给定一个字符串s s包含以空格分隔的若干个单词 请对s进行如下处理后输出 1 单词内部调整 对每个单词字母重新按字典序排序 2 单词间顺序调整 1 统计每个单词出现的次数 并按次数降序排列 2 次数相同时 按单词长度升序排列 3
  • 盒子模型的理解

    盒子模型 什么是盒子 html中的标签 元素 统统都是一个矩形的平面框 在立体上 它由多个平面构成 这称为盒子模型 从底层到顶层的立体结构 margin gt background color gt background image gt
  • CUDA各版本下载

    CUDA及CUDNN各版本下载地址 1 CUDA各版本下载地址 https developer nvidia com cuda toolkit archive CUDA 各版本下载 这个网址有点难找 2 CuDNN下载地址 需要登录 htt
  • 【英语】大学英语CET考试,口语部分2(课程笔记)

    文章目录 1 口语考试介绍与备考攻略 1 1 口语考试介绍 1 2 考试备考攻略 2 其他补充 考前 2 1 一些补充 2 2 口语考试培训 重要 上课老师 金格妃 上课时间 4h 1 口语考试介绍与备考攻略 方法是通用的 CET4 6 雅
  • React合成事件原理简单实现

    1 React合成事件是什么 React 合成事件 SyntheticEvent 是 React 模拟原生 DOM 事件所有能力的一个事件对象 即浏览器原生事件的跨浏览器包装器 它根据 W3C 规范 来定义合成事件 兼容所有浏览器 拥有与浏
  • [LeetCode-58]- Length of Last Word(最后一个单词的长度)

    文章目录 题目相关 Solution 题目相关 题目解读 求最后一个单词的长度 题目 原题链接 Given a string s consists of upper lower case alphabets and empty space
  • 2021-08-04Java Mybatis-Plus命令里面的EQ、NE、GT、LT、GE、LE分别代表含义

    EQ 就是 EQUAL等于 NE就是 NOT EQUAL不等于 GT 就是 GREATER THAN大于 LT 就是 LESS THAN小于 GE 就是 GREATER THAN OR EQUAL 大于等于 LE 就是 LESS THAN
  • MapStruct从入门到出门(二)

    数据类型转换 自动类型转换 在平常的对象映射中 总会有很多类型不完全一致的情况 例如Integer转Long String转Integer或者两个自定义对象之间的转换等 在MapStruct中定义了一些类型的自动类型转换或者说是隐形类型转换
  • Increase swap size

    Question I have an old Fedora installation on my system I have just upgraded my RAM from 256 to 512 MB My swap partition
  • SpringBoot中使用Jackson导致Long型数据精度丢失问题、处理jdk8日期类型转换

    spring boot默认使用了jackson 处理请求映射 下面通过三种方案配置 对Long类型 jdk8日期类型的自定义转换处理 方案一 注解方式 JsonSerialize using ToStringSerializer class
  • 位置式PID——小车类学习心得

    位置式PID 小车类学习心得 位置式PID 公式为 val kp err ki err sum kd err err last err变量 期望值 实际值 也就是我们常说的误差 err last变量 上一次的误差 err sum变量 误差的
  • 关于MySQL的lock wait timeout exceeded解决方案

    关于MySQL出现 lock wait timeout exceeded try restarting transaction 的解决方案 一 问题抛出 在做查询语句时 MySQL 抛出了这样的异常 MySQL server error r
  • 实验一 实现改进Bresenham算法

    实验一 实现改进Bresenham算法 一 目的 1 了解直线生成基本原理和常用方法 2 掌握改进Bresenham算法的基本原理和步骤 3 使用C OpenGL编程实现如下内容 输入线段的起始点和终止点坐标位置 利用改进Bresenham
  • 三层架构实验

    6 100 撤消 重做历史标题 加粗 颜色 背景其他列表对齐 水平线 块引用代码 资源绑定 表格 图像 视频 公式 链接 模版 目录 投票 宽屏 使用 MD 编辑器 文章标签 经验分享 添加文章标签 添加封面 标签图热门VIP 本地上传 思

随机推荐

  • 数据库期末总结笔记(《数据库系统概论》第五版(王珊、萨师煊编著))

    参考教材 数据库系统概论 第五版 王珊萨师煊版本 文章目录 1 绪论 1 1 数据库系统概述 1 2 什么是数据管理 1 3 数据库系统与人工管理 文件系统比 1 4 数据库系统特点 1 5 数据模型 1 6 数据库系统模式的概念 1 7
  • Win10安装SVN出现2503错误

    1 问题 2 原因 出现这个错误的原因是权限不足 这是win8 1的一个非常不好的地方 即使小肥的win8 1系统用的是管理员账号 但是还是无法安装成功 而且右击安装程序也没有 以管理员身份运行 按钮 3 解决 1 右击win8 1左下角的
  • Linux系统安全配置基线

    http www cnblogs com sun sunshine123 p 7119472 html 一 共享账号检查 配置名称 用户账号分配检查 避免共享账号存在 配置要求 1 系统需按照实际用户分配账号 2 避免不同用户间共享账号 避
  • python网络安全毕业设计_王国辉-利用Python做网络安全开发

    无论你想做什么任务 你都可以使用Python轻松完成任务 例如 你可以使用该语言将TCP数据包发送到计算机 执行恶意软件分析 并创建入侵检测系统 而对第三方工具的依赖性最小 然而 与C C 不同 Python并不是底层的 因此 它可能无法为
  • SpringMvc执行流程

    先看一下springMVC的流程图 1 springMvc的主要构成是 1 1 前端控制器 dispatcherServlet 1 2 请求到处理器映射 handlerMapping 1 3 处理器适配器 HandlerAdapter 1
  • 学会数据库调优,让你的数据库变得丝滑起来 mysql(文末附视频)

    MySQL 数据库是时下最流行的关系型数据库之一 但是经常使用 MySQL 数据库的朋友应该有所体会 就是 MySQL 数据库在面临高并发大数据的情况下 性能会急转直下 此时的 MySQL 数据库就会变得像 疯狂动物城 中的闪电一样 以至于
  • 在C#中List集合使用First()方法获取第一个元素的操作

    这篇文章主要介绍了在C 中List集合使用First 方法获取第一个元素的操作 具有很好的参考价值 希望对大家有所帮助 一起跟随小编过来看看吧 在C 的List集合操作过程中 如果要获取List集合中的第一个元素对象 则一般会先通过获取到l
  • gem 安装oxidized-web报错:checking for -licui18n... no处理

    在centos7服务器上安装oxidized web时 一直提示错误 Building native extensions This could take a while ERROR Error installing oxidized we
  • 作为数据分析师,如何能把AI工具和数据分析工作更好的结合?

    做为数据分析师 如果能够学会把AI工具应用到实际的数据分析工作当中 可以把一些重复性很强的工作交给AI来完成 这样数据分析师在提升效率的过程中能够去有更多的时间考虑具有创意的工作 数据分析师 在使用AI工具完成数据分析工作之前 我们首先要明
  • 从一个面试官的角度谈软件工程师的面试

    一 概要 本篇文章主要向大家分享 作为项目经理面试别人的经验 大概从面试官的角度向家分析 心理 标准 每个面试官的标准都不一样但是都差不太多 等等 年底向大家分享一波之后 方便明年开年找工作或年底换工作更轻松一点 二 详细内容 1 简历 自
  • ul ol dl 取消默认缩进

    ul ol dl 默认会缩进 在使用的时候可以使用一下方式取消缩进 例如 ul style list style none margin 0px padding 0px li 111 li li 111 li li 111 li li 11
  • 【网安神器篇】——LaZagne凭证收集工具

    作者名 Demo不是emo 主页面链接 主页传送门 创作初心 一切为了她 座右铭 不要让时代的悲哀成为你的悲哀专研方向 网络安全 数据结构 每日emo 连问候都害怕是打扰 目录 一 LaZagne 介绍 二 功能 三 跨平台性 四 免杀 五
  • sshd配置

    启动SSHD服务时报错 sshd re exec requires execution with an absolute path 解决过程 sudo ssh keygen t dsa f etc ssh ssh host dsa key
  • 生活中的算法的实际举例_三张图读懂机器学习:基本概念、五大流派与九种常见算法...

    一 机器学习概览 1 什么是机器学习 机器通过分析大量数据来进行学习 比如说 不需要通过编程来识别猫或人脸 它们可以通过使用图片来进行训练 从而归纳和识别特定的目标 2 机器学习和人工智能的关系 机器学习是一种重在寻找数据中的模式并使用这些
  • angular自定义表单控件(转)

    当我们打算自定义表单控件前 我们应该先考虑一下以下问题 是否已经有相同语义的 native 本机 元素 如
  • 【DDR3 控制器设计】(2)DDR3 初始化测试

    写在前面 本系列为 DDR3 控制器设计总结 此系列包含 DDR3 控制器相关设计 认识 MIG 初始化 读写操作 FIFO 接口等 通过此系列的学习可以加深对 DDR3 读写时序的理解以及 FIFO 接口设计等 附上汇总博客直达链接 DD
  • ansys经典界面分析工字钢_叶轮机械专题

    随着对高负荷 低重量的性能要求 风扇 压气机的叶尖速度以及叶片的柔性逐渐增大 尤其是对大涵道比的风扇叶片而言 其叶片顶部振动幅值可高达数毫米 如此大振幅的叶片振动将对叶顶间隙等处流场产生较大影响 进而影响风扇 压气机的效率 性能和稳定性 传
  • rsync下行同步+inotify实时同步部署

    目录 rsync简介 rsync同步方式 rsync特性 rsync与cp scp对比 rsync同类服务 rsync源服务器的关系 配置rsync源 rsync命令 rsync本地复制实例 配置源的两种表达方式 Rsync 同步源 配置r
  • Redis高级客户端Lettuce详解

    前提 Lettuce是一个Redis的Java驱动包 初识她的时候是使用RedisTemplate的时候遇到点问题Debug到底层的一些源码 发现spring data redis的驱动包在某个版本之后替换为Lettuce Lettuce翻
  • AttGAN

    AttGAN Facial Attribute Editing by Only Changing What You Want 摘要 本文和以往不同之处是attribute classification constraint 用来保证在生成网