一键式AI绘画,让你也能体验当画师的魅力(附原理分析)

2023-05-16

文章目录

  • 讲在前面
  • 一、Novel AI
    • 1. 网站介绍
    • 2. AI作画
  • 二、AI绘画的内在原理
    • 1. Diffusion Model的基本过程
    • 2. 扩散模型的兴起

讲在前面

大概在今年10月初期,AI作画的热潮突然被掀起,这股潮流瞬间激起了人们对于AI的思考和恐惧,一方面来说,随着AI绘画的不断完善,似乎我们每个人都能创作出满足一定要求的画作;而从另一方面来说,虽然现在的AI绘画可能还没有那么成熟,但是已经足够让人类感受到足够大的挑战,究竟还有什么职业能够抵抗得了AI的冲击,让我们从应用到原理,具体来了解一下,AI绘画是如何掀起这波热浪的。


一、Novel AI

1. 网站介绍

在这里插入图片描述

  • Novel AI:一个使用AI技术进行一系列人类所谓“想象力”创造的网站,从绘画到作文,从画出一幅满足要求的画,再到讲好一个引人入胜的故事,这里引用一句原网站的话

Driven by AI , painlessly construct unique stories , thrilling tales, seductive romances , or just fool around . Anything goes ! , 什么意思呢? 在人工智能的驱动下,不痛不痒地构建独特的故事,惊心动魄的故事,诱人的浪漫,或者只是胡闹。一切皆有可能!

在这里插入图片描述

其实人类对于AI恐惧的关键不在于AI能够进行绘画和写作,令人心惊的是, Tweak the AI’s output the way you like it,AI可以做到你想要的,无论how you like,当然,说了这么多,最重要的还是亲自上手,这里要感谢某站up主的呕心沥血,只需下载运行脚本,直接使用完整版AI绘画程序,原视频地址奉上,希望大家能够多多支持,秋枼akiiii。


2. AI作画

  • 第一步:下载并安装,这里提供一个网盘地址:百度网盘,提取码tls5

在这里插入图片描述

  • 第二步:解压zip文件

在这里插入图片描述

  • 第三步:在文件中找到点击生成启动脚本的文件,打开即可自动安装对应依赖
  • 第四步:在文件中找到启动脚本,打开即可自动运行

在这里插入图片描述

  • 第五步:在脚本运行完成后,会出现对应的本地端口,复制在浏览器打开即可

到这里,就能在浏览器中看到一个拥有良好界面的网站,自行选择文本生成或图生图等方式即可,这里用文本生成做一个简单演示,在正面和负面标签输入一些自己想要的单词或短语即可:

在这里插入图片描述
在这里分享一下自己使用该功能完成的作品:

在这里插入图片描述


二、AI绘画的内在原理

1. Diffusion Model的基本过程

  • 什么是Diffusion Model:深度学习中的一种生成模型,与GAN、VAE、Flow-based等类似;

在这里插入图片描述
不同生成模型之间的对比:Diffusion model和其他模型最大的区别是它的latent code(z)和原图是同尺寸大小的。一句话概括diffusion model,即存在一系列高斯噪声,将输入图片变为纯高斯噪声。而我们的模型则负责将噪声处理后的图片复原回图片

  • Diffusion Model的过程:

\qquad 1. 前向过程:
在这里插入图片描述
在这里插入图片描述

往图片上加噪声的过程,给定真实图片后, diffusion前向过程通过多次累计对其添加高斯噪声;这里需要给定一系列的高斯分布方差的超参数,前向过程由于每个时刻t只与t-1时刻有关,所以也可以看做马尔科夫过程:这个过程中,随着t的增大, 越来越接近纯噪声

\qquad 2. 逆向过程:
在这里插入图片描述
在这里插入图片描述

即Diffusion的去噪推断过程,如果我们能够逐步得到逆转后的分布,就可以从完全的标准高斯分布还原出原图分布,我们使用深度学习模型(参数为θ,目前主流是U-Net+attention的结构)去预测这样的一个逆向的分布,通过贝叶斯公式等得到高斯噪声的参数,最终通过模型特性实现逆向;


\qquad 3. 最终通过对真实数据分布下,最大化模型预测分布的对数似然过程(上述基于DDPM)

  • 具体的训练及演化过程这里不细致分析,详情可见由浅入深了解Diffusion Model

2. 扩散模型的兴起

  • 相比于GAN的优势:
  1. GAN模型训练过程有个难点,就是众多损失函数的鞍点(saddle-point)的最优权重如何确定,在实际训练过程中需通过多次反馈,直至模型收敛,但是可怕的是在实际操作中发现,损失函数往往不能可靠地收敛到鞍点,导致模型稳定性较差;与GAN不同,DALL·E使用Diffusion Model,不用在鞍点问题上纠结,只需要去最小化一个标准的凸交叉熵损失(convex cross-entropy loss),这样就大大简化了模型训练过程中,数据处理的难度
  2. GAN模型在训练过程中,除了需要“生成器”,将采样的高斯噪声映射到数据分布;还需要额外训练判别器,Diffusion Model只需要训练“生成器”,训练目标函数简单,而且不需要训练别的网络(判别器、后验分布等)
  • 领域跨越:目前的训练技术让Diffusion Model直接跨越了GAN领域调模型的阶段,而是直接可以用来做下游任务

Diffusion Model的成功在于训练的模型只需要“模仿”一个简单的前向过程对应的逆向过程,而不需要像其它模型那样“黑盒”地搜索模型,并且,这个逆向过程的每一小步都非常简单,只需要用一个简单的高斯分布来拟合

  • 扩散模型的拓展:原始扩散模型拥有三个缺点,采样速度慢,最大化似然差、数据泛化能力弱,它的采样速度慢,通常需要数千个评估步骤才能抽取一个样本;它的最大似然估计无法和基于似然的模型相比;它泛化到各种数据类型的能力较差。如今很多研究已经从实际应用的角度解决上述限制做出了许多努力,或从理论角度对模型能力进行了分析。

在这里插入图片描述

  • 参考文献:

[1] Sohl-Dickstein J, Weiss E, Maheswaranathan N, et al. Deep unsupervised learning using nonequilibrium thermodynamics[C]//International Conference on Machine Learning. PMLR, 2015: 2256-2265.
[2] Ho J, Jain A, Abbeel P. Denoising diffusion probabilistic models[J]. Advances in Neural Information Processing Systems, 2020, 33: 6840-6851.
[3] Song Y, Sohl-Dickstein J, Kingma D P, et al. Score-based generative modeling through stochastic differential equations[J]. arXiv preprint arXiv:2011.13456, 2020.
[4] Yang L, Zhang Z, Song Y, et al. Diffusion models: A comprehensive survey of methods and applications[J]. arXiv preprint arXiv:2209.00796, 2022.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

一键式AI绘画,让你也能体验当画师的魅力(附原理分析) 的相关文章

  • springMVC中bean容器:bean.xml的配置

    lt xml version 61 34 1 0 34 encoding 61 34 UTF 8 34 gt lt beans xmlns 61 34 http www springframework org schema beans 34
  • Maven+spring +dubbo+zookeeper

    maven 43 springmvc 43 dubbo 43 zookeeper 为什么要用dubbo xff1f 还是让官方来解释吧 xff1a http dubbo io User 43 Guide zh htm http dubbo
  • window环境搭载elasticsearch学习(一)

    前言 xff1a 没太大比较 xff0c 因为工作项目需要 短时间运用elasticsearch做一个简单demo并能够实现一些简单操作 xff0c 所以选择用了windows环境 估计会比较多的坑 xff0c 让我们积极入坑吧 一 官网下
  • window环境搭载elasticsearch学习(三)--中文分词器

    前言 系统 xff1a Windows10 elasticsearch版本 xff1a 5 6 6 中文分词版本 xff1a 5 6 6 xff08 需要与elasticsearch版本匹配 xff09 maven版本 xff1a 3 5
  • 基于Windows10基于Linux的C语言笔记Ⅰ

    这玩意儿就是自己的学习笔记 xff0c 不过 xff0c 也可以用来入门学习C语言 However xff0c 你需要 xff1a 学习C语言兴致 xff0c Windows10 xff08 或者你有一台Linux系统的电脑 xff09 x
  • PDF文件中电子签名(安全性、有效性、合法性)验证指南

    电子合同是电子签名较为常见的一种应用方式 xff0c 目前大多数的的电子合同与电子文书都采用PDF的文件格式 本文以PDF格式的电子合同为例解释如何验证电子签名的安全性 有效性与合法性 xff08 下文统称 验签 xff09 xff0c 同
  • 数据结构专题——二叉树

    什么是二叉树 通俗的讲就是树上每一个节点最多有两个子节点 官方的递归定义是 xff1a 要么二叉树没有根节点 xff0c 是一颗空树要么二叉树由根结点 左子树 右子树组成 xff0c 且左右子树也都是二叉树 这里有两种特殊的二叉树 满二叉树
  • CSS filter滤镜属性使用

    前言 CSS的滤镜filter属性 xff0c 可以对网页中的图片进行类似Photoshop图片处理的效果 xff0c 通过CSS对图像进行处理 xff0c CSS的filter属性可以得到一些类似PS的滤镜效果 浏览器支持情况 xff1a
  • vtk中的剪裁

    在VTK中 xff0c 我们通常需要的并不是严格标准的几何体 xff0c 我们需要对这些几何体进行加工 xff0c 修改其内容 xff0c 得到我们想要的效果 xff0c 下面结合例子介绍如何在VTK中实现对几何体的裁剪 要对几何体进行裁剪
  • Ubuntu18.04搭建jenkins,并关联Github

    一 Ubuntu搭建jenkins 1 安装Java环境 sudo apt install openjdk 11 jre headless 创建一个Jenkins目录 xff0c 并进入 mkdir Jenkins cd Jenkins 3
  • 使用FOFA进行资产收集

    使用FOFA进行资产收集 FOFA是一款空间搜索引擎 它可以通过进行网络空间测绘快速进行网络资产匹配FOFA官方地址 https fofa so 我们使用FOFA进行搜索资产的时候他是不区分大小写的 xff1b 并且我们可以使用一些逻辑连接
  • python针对文本的操作

    Python文件的处理 1 我们可以把文件想象成一个仓库 xff1b 可以供我们操作使用 针对文件的操作流程为 xff1a 打开文件并且创建对象 xff1b 对该文件内容进行 读取 写入 删除 修改等操作 关闭并且保存 2 常用操作函数 o
  • 【CVE-2016-3088】 Activemq文件上传以及弱口令

    CVE 2016 3088 PUT方法上传文件 自建环境 漏洞描述 Apache ActiveMQ是美国阿帕奇 xff08 Apache xff09 软件基金会的一套开源的消息中间件 Apache ActiveMQ 5 14 0之前5 x版
  • Apache SSI 远程命令执行漏洞

    apache ssi 文件上传导致的命令执行 漏洞描述 如果目标服务器开启了SSI与CGI支持 这样我们就可以上传一个可执行的shtml文件 漏洞复现过程 1 访问文件上传页面进行上传可执行文件shtml文件 2 访问我们上传成功的shtm
  • Linux周期计划及开启自启动

    Linux 周期计划 linux的周期计划是由crond服务控制 systemctl status crond 进行查看服务运行状态 Linux 周期计划可分 系统性周期计划 用户周期性计划 系统性周期计划 xff1a etc cronta
  • Tableau实现增量刷新

    为了节省tableau的刷新时间 xff0c 有时候我们只需要增量刷新就可以了 xff0c 设置如下图 选择菜单栏的 数据 提取刷新 所有行 增量刷新 xff0c 然后再选择对应的增量标识符就可以了 xff0c 比如我选择的是日期 DOB
  • 潘多拉盒子 使用 hd-idle 硬盘休眠设置

    潘多拉盒子 使用 hd idle 硬盘休眠设置 潘多拉或OpenWrt路由器你去 挂载点 那里去看路径 比如你挂载的是 dev sda5 xff08 1 2 3 5看自己路由器挂载硬盘的情况 xff09 路径 xff0c 那么硬盘休眠就写这
  • nigix代理失败的排查过程

    背景 在刚开始迁移的过程中 xff0c 由于经常进 部署实验 xff0c 需要 便进 dns解析更换IP的操作 xff0c 在预发布域名解析中申请了七层负载均衡的vip xff0c 通过vip来调整具体的解析ip 问题 这时问题就发 了 x

随机推荐