Stable Diffuse 之 安装文件夹、以及操作界面 UI 、Prompt相关说明

2023-10-27

Stable Diffuse 之 安装文件夹、以及操作界面 UI 、Prompt相关说明

目录

Stable Diffuse 之 安装文件夹、以及操作界面 UI 、Prompt相关说明

一、简单介绍

二、安装文件相关说明

三、界面的简单说明

四、prompt 的一些语法简单说明

1、Prompt :正向提示词 ,用文字描述在图像中出现的内容

2、Negative prompt:负面提示词,用文字描述不想在图像中出现的内容


一、简单介绍

Stable Diffusion是一个文本到图像的潜在扩散模型,由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的512x512图像进行训练。使用这个模型,可以生成包括人脸在内的任何图像,因为有开源的预训练模型,所以我们也可以在自己的机器上运行它,如下图所示。

Stable Diffusion是一个AI 绘图软件 (开源模型),可本地部署,可切换多种模型,且新的模型和开源库每天都在更新发布,最重要的是免费,没有绘图次数限制。

Github 网址:GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI

二、安装文件相关说明

下面进行以下文件夹进行简单说明:

1)embeddings

2)extensions

3)models

4)outputs

1、embeddings

embeddings 放置训练的 embedding 模型,它可以在我们使用基础模型时,再添加此模型进行叠加效果。 网页界面 UI 对应位置如图

2、extensions

extensions 插件安装目录,在 WebUI 插件安装界面安装后,可以此文件夹中查看,并上传相应的插件模型(如 ControlNet 需要专门的模型)。 网页界面 UI 对应位置如图

3、models

models 模型文件夹,安装时会默认下载 v1-5-pruned-emaonly,我们从其它地方下载的模型可以拷贝到此文件夹,在需要使用某个模型时,可以进行切换, 网页界面 UI 对应位置如图

4、outputs

outputs 生成的图系统会输出到这个文件夹里,可进行查看及保存。 网页界面 UI 对应位置如图

三、界面的简单说明

1、txt2img: 文字生成图片

Sampling method:采样方法

● Euler a :富有创造力,不同步数可以生产出不同的图片。 超过 30~40 步基本就没什么增益了

● Euler:最常见的基础算法,最简单也最快

● DDIM:速度快,一般 20 步差不多

● LMS:eular 的延伸算法,相对更稳定一点,30 步就比较稳定

● PLMS:改进一点的 LMS

● DPM2:DDIM 的一种改进版,速度大约是 DDIM 的两倍

Sampling Steps:采样迭代步数

先随机出一个噪声图片,然后一步步调整图片,向提示词 Prompt 靠拢。其实就是告诉 Stable Diffusion,这样的步骤应该进行多少次,步骤越多,每一步移动也就越小越精确,同时也成比例地增加生成图像所需要的时间。大部分采样器超过 50 步后意义就不大了

Restore faces:优化面部,绘制面部图像特别注意。原理是调用一个神经网络模型对面部进行修复

Tiling:生成一个可以平铺的图像

Highres. fix:先生成低分辩率的图,接着添加细节之后再输出,可以把低分辨率的照片调整到高分辨率

Batch count、 Batch size: 都是生成几张图,前者计算时间长,后者需要显存大

Denoising strength:决定算法对图像内容的保留程度。因为加的噪声少,原图片部分多,加的噪声多,原图片部分少。在 0 处,什么都不会改变,而在 1 处,你会得到一个不相关的图像

CFG Scale:对描述参数的倾向程度(也就是生成图像与提示词的一致程度),越低的值产生越有创意的结果,如果太低,例如 1,那 Promp t就完全没用了。一般在 5~15 之间为好,7,9,12 是 3 个常见的设置值

Seed:种子数,只要种子数、参数、模型都一致,就能重新生成一样的图像,-1 的话是生成一个随机数

2、img2img: 图片生成图片

与 txt2img 类似,在文字提示词的基础上,增加了图片提示。

Denoising strength:与原图一致性的程度,一般大于 0.7 出来的都是新效果,小于 0.3 基本就会原图一致

3、Extras: “无损”放大图片,优化(清晰、扩展)图像

主要将图像进行优化,Resize 设置放大的倍率,GFPGAN visibility 主要对图像清晰度进行优化,CodeFormer visibility 对于老照片及人脸修复很有效,权重参数为 0 时效果最大,为 1 时效果最小,建议从 0.5 开始尝试。

Upscaler 放大算法,一般不清楚可不选,或者选 ESRGAN_4x

Batch from Directory 可以进行批量处理,在 Input directory 中输入需要批量处理图片的目录,在 Output directory 中输入保存结果目录。

Scale to 中,可自定义图片的尺寸

4、PNG info:从图片 exif 里获取图片的信息,如果是 Stable Diffusion 原始生成的 png 图片,图片的 exif 信息里会写入图片生成参数

5、Checkpoint Merger:合并不同的模型,生成新的模型

6、Train:训练 embedding 或者 hypernetwork

7、Settings:设置页面

8、Extensions:插件的安装和管理页面

installed 表示已经安装好的插件

Available 表示在线可用的插件,一般都是从这里安装。

点击 Load from(加载自): 加载出可用的插件,然后按 Ctrl + F,输入想要安装插件的名称,以此进行查找。

install from URL 表示可以根据网址进行制定安装,这里网址一般指的是github 仓库地址

Backup/Restore 用来备份和恢复制定配置的

四、prompt 的一些语法简单说明

1、Prompt :正向提示词 ,用文字描述在图像中出现的内容

正向提示词例子:

(masterpiece:1.331), best quality,illustration,(1girl),
(deep pink hair:1.331), (wavy hair:1.21),(disheveled hair:1.331), messy hair, long bangs, hairs between eyes,(white hair:1.331), multicolored hair,(white bloomers:1.46),(open clothes),
beautiful detailed eyes,purple|red eyes),expressionless,sitting,dark background, moonlight,flower_petals,city,full_moon, 

分隔:不同的关键词tag之间,需要使用英文逗号 , 分隔,逗号前后有空格或者换行不影响结果。例如:1girl,loli,long hair,low twintails(1 个女孩,loli,长发,低双马尾)

混合:WebUI 使用 | 分隔多个关键词,实现混合多个要素,注意混合是同等比例、同时混。例如:1girl,red|blue hair, long hair(1个女孩,红色与蓝色头发混合,长发)

增强/减弱:有两种写法。

● 第一种 (提示词:权重数值):数值从0.1~100,默认状态是 1,低于 1 就是减弱,大于 1 就是加强。例如:(loli:1.21),(one girl:1.21),(cat ears:1.1),(flower hairpin:0.9)

● 第二种 (((提示词))),每套一层()括号增强 1.1 倍,每套一层 [] 减弱 1.1 倍。也就是套两层是1.1*1.1=1.21 倍,套三层是 1.331 倍,套 4 层是 1.4641 倍。例如: ((loli)),((one girl)),(cat ears),[flower hairpin],这与第一种写法等价,所以还是建议使用第一种方式。

渐变:可简单的理解时为,先按某种关键词生成,然后再此基础上向某个方向变化。

[关键词1:关键词2:数字],数字大于 1 理解为第 X 步前为关键词 1,第 X 步后变成关键词 2,数字小于 1 理解为总步数的百分之 X 前为关键词 1,之后变成关键词 2。

例如:a girl with very long [white:yellow:16] hair 等价为开始 a girl with very long white hair

,16步之后 a girl with very long yellow hair

例如:a girl with very long [white:yellow:0.5] hair 等价为开始 a girl with very long white hair,50% 步之后 a girl with very long yellow hair

交替:轮流使用关键词,例如:[cow|horse] in a field,这就是个牛与马的混合物;[cow|horse|cat|dog] in a field 就是牛、马、猫、狗之间混合。

2、Negative prompt:负面提示词,用文字描述不想在图像中出现的内容

一些常见的负面提示词:

lowres,bad anatomy,bad hands,text,error,missing fingers,
extra digit,fewer digits,cropped,worst quality,
low quality,normal quality,jpeg artifacts,signature,
watermark,username,blurry,missing arms,long neck,
Humpbacked,missing limb,too many fingers,
mutated,poorly drawn,out of frame,bad hands,
owres,unclear eyes,poorly drawn,cloned face,bad face

prompt 提示词先介绍到这里,后面将会一篇单独文章进行说明

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Stable Diffuse 之 安装文件夹、以及操作界面 UI 、Prompt相关说明 的相关文章

  • JAVA产生五位随机验证码

    用Java写出一个程序产生5位验证码 且前四位是字母不限大小写最后一位是数字 解法一 import java util Random public class YanZhengMa public static void main Strin

随机推荐

  • 【华为面试题】栈

    思路 首先 遍历输入的压缩字符串 三种情况 1 遇到字符 将其入栈 2 遇到字符 计算重复次数 将栈中的字符组合成一个字符串 重复拼接后再入栈 3 遇到字母字符 判断下一个字符是否是数字 若是数字 则将当前字母重复拼接后入栈 若不是数字 则
  • mysql的安装与使用

    1 mysql下载与安装 下载解压 下载地址 https dev mysql com downloads mysql 5 7 html downloads 下载到指定位置 如D mysql 5 7 23 winx64 把解压的文件夹bin目
  • 计算机系统课程 笔记总结 CSAPP第二章 信息的表示和处理(2.3-2.4)

    GitHub计算机系统CSAPP课程资源 计算机系统课程 笔记总结 CSAPP第二章 信息的表示和处理 2 1 2 2 计算机系统课程 笔记总结 CSAPP第二章 信息的表示和处理 2 3 2 4 计算机系统课程 笔记总结 CSAPP第三章
  • opencv android 服务包,Unity中使用C++ OpenCV并且打包为Android apk

    我们需要在Unity中使用WebCamTexture获取图像 传送到OpenCV中做处理 然后返回到Unity中作显示 Unity通过调用动态链接库so与OpenCV进行通信 最终程序会打包成APK并且在Android上运行 系统环境 Vi
  • 华为OD机试 Python 【座位调整】

    描述 由于疫情原因 学生之间的座位要保持一定距离 每个学生的左右都要至少有一个空座 给定一个代表座位情况的数组desk 其中1代表有学生坐在那个位置 0代表该位置为空 问你在保持疫情安全距离的前提下 我们还能安排多少学生 输入 一个整数数组
  • cuda运行时库配置问题

    总是遇到一堆问题 这次遇到的问题和这个类似 http cudazone nvidia cn forum forum php mod viewthread tid 483 先看了一些文章 明白了是因为VC在编译和链接过程用的默认库被新库取代
  • vue动态加载页面组件

    问题说明 在开发时遇到一个问题 在同一个页面 局部页面要根据下拉框的选项来动态加载不同的页面 参考 1 Vue 下拉框代码
  • 论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod

    2018 Geophysical Journal International 1 Intro 1 1 Motivation 地震检测和定位是地震学的基础 地震目录的质量主要取决于到达时间测量的数量和准确性 地震到达时间测量或相位选择通常由网
  • Linux服务器磁盘分区、挂载、卸载及报错处理

    整体操作是 先对磁盘进行格式化 格式化后挂载到需要的挂载点 最后添加分区启动表 以便下次系统启动时自动挂载 一 linux分区 1 Linux来说wulun有几个分区 分给哪一目录使用 他归根结底只有一个根目录 一个独立且唯一的文件结构 L
  • restapi(1)- 文件上传下载服务

    上次对restapi开了个头 设计了一个包括了身份验证和使用权限的restful服务开发框架 这是一个通用框架 开发人员只要直接往里面加新功能就行了 虽然这次的restapi是围绕着数据库表的CRUD操作设计的 但文件类数据在服务端与客户端
  • azkaban简介及azkaban部署、原理和使用介绍

    azkaban简介及azkaban部署 原理和使用介绍 azkaban简介 Azkaban是一套简单的任务调度服务 整体包括三部分webserver dbserver executorserver Azkaban是由Linkedin开源的一
  • Effective C# 摘录(5) - 使用框架

    35 重写函数优于事件处理器 Prefer Overrides to Event Handlers e g 实现Form实例时 选择重写OnMouseDown 方法而不是添加事件句柄OnMouseDown 使用事件有更大的伸缩性 可以在一个
  • 1一9数字行书写法_考试不粗心—实用训练6法

    考试粗心是指在对相应的知识和技能构成掌握的前提下 学生在考试中出现遗漏与错误的心理现象 主要表现为在计算时容易将相似的字符混淆 在书写与运算过程中将个别文字 数位 小数点 甚至是题目本身遗漏 在作业过程中将计算类型弄错 忽略正确的计算顺序
  • 睿智的目标检测43——TF2搭建Retinaface人脸检测与关键点定位平台(tensorflow2)

    睿智的目标检测43 TF2搭建Retinaface人脸检测与关键点定位平台 tensorflow2 学习前言 什么是Retinaface人脸检测算法 源码下载 Retinaface实现思路 一 预测部分 1 主干网络介绍 2 FPN特征金字
  • nginx 部署vue项目

    首先需要在服务器里下载nginx apt get install nginx 检查nginx是否安装 输入如下命令后若出现版本号则安装成功 nginx v 然后启动nginx server nginx restart 如果有如下报错 则按照
  • 100天精通Python(数据分析篇)——第70天:Pandas常用排序、排名方法(sort_index、sort_values、rank)

    文章目录 一 按索引排序 sort index 1 Series类型排序 1 升序 2 降序 2 DataFrame类型排序 1 按行索引排序 2 按列索引排序 二 按值排序 sort values 1 Series类型排序 1 升序 2
  • 2023 QEMU模拟FT2000+(armv8)运行麒麟V10并安装tensorflow2

    2023 QEMU模拟FT2000 armv8 运行麒麟V10并安装tensorflow2 资源准备 麒麟V10SP1 桌面 QEMU 4 1 0以上 qeum安装kylin python tensorflow2 10 0 资源准备 麒麟V
  • python--pandas学习总结

    目录 一 Series和DataFrame 1 pandas Series 2 pandas DataFrame 二 Pandas常见用法 1 访问数据 1 1 head 和tail 1 2 describe 1 3 T 1 4 sort
  • BES提示音

    基于BES2500提示音的日志 11656 I NONE L M 13 threadpredict awaken label 1 11656 I NONE L M 13 app voice report handler 11656 I NO
  • Stable Diffuse 之 安装文件夹、以及操作界面 UI 、Prompt相关说明

    Stable Diffuse 之 安装文件夹 以及操作界面 UI Prompt相关说明 目录 Stable Diffuse 之 安装文件夹 以及操作界面 UI Prompt相关说明 一 简单介绍 二 安装文件相关说明 三 界面的简单说明 四