惊艳了!升级版的 APDrawing,秒让人脸照变线条肖像画

2023-11-20


作者 | 高卫华

出品 | AI科技大本营

随着深度学习的发展,GAN模型在图像风格转换的应用越来越多,其中不少都实现了很好的效果。

此前,reddit上的一个技术博主AtreveteTeTe基于GAN模型混合将普通的人像照片卡通化,并通过First Order Motion模型生成了动画,引起诸多网友的热捧。像这类卡通风格的画像生成,通常对单元素的质量要求不高,对于模型的训练,会忽略一些细节上的不足。

不过,最近一个开发者在GitHub上放出了一个可用于创建线条艺术肖像的项目,基于深度学习开发了ArtLine,其创建的线条肖像画在细节上的呈现效果惊人。

项目链接:

https://github.com/vijishmadhavan/ArtLine

ArtLine最简单的入门方法:

https://colab.research.google.com/github/vijishmadhavan/Light-Up/blob/master/ArtLine(Try_it_on_Colab).ipynb

艺术肖像线条画方面,去年清华大学曾提出一个层次化的GAN模型APDrawingGAN,可以有效地基于人脸照片生成高质量、富有表现力的线条画。

但APDrawingGAN在识别面部特征方面存在局限性,例如在识别与ID照片类似的正面照片时,需要照片具有清晰的面部特征以及无佩戴眼镜或者面部有明显皱纹。

而ArtLine可以解决这项局限性,同时可以识别任何人物姿态的图像。其生成的肖像画在脸部、眼睛、嘴唇和鼻子周围是否达到适当的线条,完全取决于提供给模型的数据。

APDrawing数据集主要由特写肖像组成,该模型难以对衣服、手等进行重新着色。因此,ArtLine结合使用了从Anime sketch着色对数据集中选择的图像,帮助模型更好地了解线条细节。

这是使用ArtLine即时创建的电影海报。

技术实现

  • 自注意力的GNN

ArtLine采用Self-Attention Generative Adversarial Network(简称SAGAN)生成器,该模型是经过预训练的UNET,具有频谱归一化和自我注意功能,可为图像生成任务提供注意力驱动的远程依赖关系建模。

传统的卷积GAN,根据低分辨率特征图中空间局部点的函数来生成高分辨率的细节。而在SAGAN中,可以使用来自所有要素位置的提示来生成细节。并且,鉴别器可以检查图像部分中的详细特征是否一致。

此外,据最近的研究表明,生成器调节会影响GAN的性能。为此,将频谱归一化应用于GAN生成器,以改善训练动态。

SAGAN实现了最先进的效果,在具有挑战性的ImageNet数据集上,将已发布的Inception分数从36.8提高到52.52,并将Frechet Inception距离从27.62降低到18.65。据注意层的可视化显示,生成器利用了与对象形状相对应的邻域,而不是固定形状的局部区域。

  • GAN逐步提高质量、稳定性和多样性

ArtLine使用生成对抗网络的新训练方法,关键思想是从低分辨率开始添加新层,逐渐增加生成器和鉴别器,以随着训练的进行对越来越细的细节建模。这既加快了训练速度,又极大地提高了生成图像的质量。

训练中,ArtLine采用一种用于评估图像质量和变化等GAN结果的新指标,并构建了CelebA数据集更高质量的版本。

  • 生成器损失:基于VGG16的感知损失/特征损失。

进行高质量图像的转换时,通常使用输出图像与真实图像之间的每像素损失来训练前馈卷积神经网络。而研究表明,高质量图像也可通过从预训练网络提取高级特征,定义和优化感知损失函数来生成。

结合这两种方法的优势,ArtLine使用感知损失函数来训练用于图像转换任务的前馈网络。与基于优化的方法相比,ArtLine可给出相似质量的图像转换结果,但其生成速度快了三个数量级。对于单图像超分辨率的方法,实验表明将每像素损失替换为感知损失,视觉上会更令人愉悦。

目前,ArtLine在图像生成时也存在一些问题,如其生成器会将照片阴影与头发混淆;另外,对于低于500像素的低质量图像,ArtLine的图像转换效果不佳。

论文链接:

https://arxiv.org/abs/1805.08318

https://arxiv.org/abs/1710.10196

https://arxiv.org/pdf/1603.08155.pdf

更多精彩推荐
☞谷歌知名前 AI 研究员无辜被裁,CEO:调查!
☞惨烈!上班摸鱼被老板张一鸣抓现场...... | 每日趣闻
☞苏宁回应股权质押给淘宝:正常合作;苹果App Store被越狱商店指控垄断;Docker 20.10.0发布|极客日报☞【官方福利】CSDN内测师限时申请,参与赢年末礼包

☞一文聊“图”,从图数据库到知识图谱
☞区块链赋能物流行业:“圈子文化”下,网络货运的数字化转型之路
点分享点点赞点在看

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

惊艳了!升级版的 APDrawing,秒让人脸照变线条肖像画 的相关文章

随机推荐

  • 表示不变量

    不变量 产生好的ADT设计 其中最重要的一点就是它会保护 保留自己的不变量 不变量是一种属性 它在程序运行的时候总是一种状态 而不变性就是其中的一种 一旦一个不变类型的对象被创建 它总是代表一个不变的值 当一个ADT能够确保它内部的不变量恒
  • Java内存模型

    Java内存模型 处理器需要与内存交互 如读取运算数据 存储运算结果等 这个I O操作是很难消除的 无法仅靠寄存器来完成所有运算任务 由于计算机的存储设备与处理器的运算速度有几个数量级的差距 所以现代计算机系统都不得不加入一层读写速度尽可能
  • GitHub上传新手

    第一次上传 1 注册GitHub 2 新建仓库 网上有新建教程 很简单的 3 下载安装Git 一般一直下一步即可 没有特殊要求的话 网址 https gitforwindows org 4 在Git Bush中进入放项目文件的地址 如果是直
  • CentOS7上安装anaconda3及其遇到的问题

    https mirrors tuna tsinghua edu cn anaconda archive 国内镜像 下载速度快 不要选择最新版 有问题 建议 4 3 0 运行命令 conda V 返回版本号即安装成功 1 通过命令行工具 wg
  • 必须了解的mysql三大日志-binlog、redo log和undo log

    目录 一 前言 二 binlog 备份日志 1 作用 2 使用场景 3 日志形式 4 binlog刷盘时机 三 redo log 重做日志 1 概念 2 为什么需要redo log 3 日志形式 4 redo log与binlog区别 四
  • 锂电池基础知识简介

    锂离子电池已经渗透到现代生活的方方面面 它可以为生活中很多东西 如手机 手表 平板电脑 便携式设备等 提供电源 现简单概要介绍锂电池的基础知识 1 基础术语 1 C rate 倍率 指电池充放电时电流与电池标称容量的比率 即描述了电池可以在
  • FPGA Lattice Diamond 开发环境搭建

    FPGA Lattice Diamond 开发环境搭建 Lattice Diamond 软件下载 在浏览器中输入 Lattice 的官网地址 http www latticesemi com 进入官网首页在上方选择产品系列选项 出现如下图所
  • Unity学习笔记(一)—— 基础知识

    一 基础知识 1 开发团队组成 2 unity特点 图形界面 所见即所得 入门简单 支持C 比OC C 更友好 js 国内外资源丰富 因为使用的人多 跨平台性好 PC端 移动端等 对VR AR的支持最完善 3 成功案例 游戏 炉石传说 神庙
  • 【源码篇】基于ssm+bootstrap+jquery的学生成绩管理系统

    系统介绍 基于ssm bootstrap jquery的学生成绩管理系统一共分为六大模块 分别是用户管理 课程管理 班级管理 学籍管理 学费管理 成绩管理 用户管理 1 用户信息预览 查询并根据姓名搜索系统用户 2 新增用户信息 添加系统用
  • Redis7之事务(五)

    五 Redis 事务 5 1 介绍 可以一次执行多个命令 本质是一组命令的集合 一个事务中的所有命令都会序列化 按顺序地串行化执行而不会被其他命令插入 不许加塞 一个队列中 一次性 顺序性 排他性的执行一系列命令 5 2 Redis事务和数
  • 包管理工具那么多,怎么选?npm、yarn 和 pnpm 三者比较及使用详解!

    1 简介 在 Vue 项目中 我们需要使用许多第三方依赖库 如 Vue Router Vuex Axios Element UI 等等 这些依赖库通常以 NPM 包的形式提供 而且在使用时需要进行版本管理 因此 我们需要使用一个包管理工具来
  • TCP/IP详解 第十二章(2) linux 网络编程

    转载请声明博主https mp csdn net console editor html 106517098 一 Linux网络概述 LINUX网络优势 1 完善的内置网络 和内核结合在一起的网络部分 I p queue 2 Linux 免
  • python将超大CSV文件切割为多个Excel文件存储

    很多时候处理数据会碰到CSV文件 如果是一般的少量文件问题不大 一旦碰到大型的CSV文件 就会出现打不开文件的结果 因为文本无法打开超大型文件 Excel也最多能够容量一百万条数据量 因此只能将CSV文件切割成为多个小的CSV文件 将csv
  • Swing之Jframe窗体、 JDialog弹窗、标签、面板、按钮(图片按钮,单选框,多选框)、列表(下拉框,列表框)、文本框、密码框

    Swing Jframe窗体 import javax swing import java awt public class JFrameDemo init 初始化 public void init JFrame frame new JFr
  • Vue 组件化

    什么是组件化 任何一个人处理信息的逻辑能力都是有限的 所以 当面对一个非常复杂的问题时 我们不太可能一次性搞定一大堆的内容 但是 我们人有一种天生的能力 就是将问题进行拆解 如果将一个复杂的问题 拆分成很多个可以处理的小问题 再将其放在整体
  • 每月的倒扣料

    这是一个生产领料的典型 倒扣法 即BOM配置的单位和发料单位不相同时 我们不可能通过转换而达到发料的方便 比较典型的物料有 电线 按米领料 发料时要按捆化工 按kg领料 发料时按桶等等 通常在实施的时候 先将一捆电线调拔到线边仓库 仓管操作
  • 利用人工智能技术普及教学应用、拓展教师研训应用、增强教育系统监测能力

    2019年 中国教育现代化2035 指出 以人才培养为核心 通过提升校园智能化水平 探索新型教学形式 创新教育服务业态 推进教育治理方式变革 智能驱动教育创新发展 2021年教育部等六部门发布 关于推进教育新型基础设施建设构建高质量教育支撑
  • Linux C/C++编程:对文件操作的封装

    Linux C C 编程 lseek fseek ftell rewind fgetpos fsetpos 源码 Created by oceanstar on 2021 8 9 ifndef OCEANSTAR HTTP ACL FILE
  • 企业网上订货管理软件构架源码系统介绍

    企业网上订货管理软件构架源码系统介绍 手机订单管理系统 一 什么是订货通 什么是企业订货管理系统 是一款针对中小型企业通过网络实现 厂家和客户 经销商 批发商 代理商一站式订货系统 最终实现厂家的下游客户通过网络实现实时订货功能 二 订货通
  • 惊艳了!升级版的 APDrawing,秒让人脸照变线条肖像画

    作者 高卫华 出品 AI科技大本营 随着深度学习的发展 GAN模型在图像风格转换的应用越来越多 其中不少都实现了很好的效果 此前 reddit上的一个技术博主AtreveteTeTe基于GAN模型混合将普通的人像照片卡通化 并通过First