Stable Diffusion学习记录

文章目录

  • 前言
  • 电脑配置推荐
  • 环境搭建
    • 下载地址
    • 安装步骤
      • 步骤一,打开下载的秋叶整合包,路径秋叶整合包/sd-wenui-aki
      • 步骤二,打开下载好的sd-webui-aki-v4.8.7解压包
  • Stable Diffusion软件配置,插件安装,模型下载
    • Stable Diffusion Web UI文件夹作用
      • embeddings文件夹
      • extensions文件夹
      • models文件夹
    • 大模型下载
  • Stable Diffusion提示词
    • 提示词原理
      • 提示词基础
      • 符号解释
        • 权重控制
        • Lora文件触发
        • 提示词连接
    • 进阶语法
    • 提示词推荐格式
      • 画质
      • 画风
      • 反向提示词
    • prompt-all-in-one插件
  • Stable Diffusion 采样器
    • 老派采样器
    • DPM采样器
    • 新派采样器
  • 相关链接

前言

Stable Diffusion是一个开源免费能生成以假乱真的图片、有着强大可控性不能制作视频光影文字的AI软件,可以说是有必要学习的东西了,这里是基于秋叶大神整合的Stable Diffusion Web UI进行接触和学习。

电脑配置推荐

系统要求:Win10 or Win11
显卡:RTX2060以上,6GB显卡显存
内存:8GB,推荐16GB
硬盘:预留20-100GB硬盘空间

环境搭建

下载地址

这里使用秋叶aaaki整合包:链接:https://pan.baidu.com/s/1Q2k5nkPCFIWPpDOG6WJThg
提取码:3kg0

安装步骤

步骤一,打开下载的秋叶整合包,路径秋叶整合包/sd-wenui-aki

打开启动器运行依赖安装教程.docx文件
在这里插入图片描述
复制下载链接:
https://dotnet.microsoft.com/en-us/download/dotnet/thank-you/runtime-desktop-6.0.25-windows-x64-installer?cid=getdotnetcore

下载为Microsoft Windows Desktop Runtime启动器运行依赖,下载好进行安装
在这里插入图片描述

步骤二,打开下载好的sd-webui-aki-v4.8.7解压包

解压这个文件,注意解压的路径不能包含任何中文路径
解压密码:bilibili@秋葉aaaki
在这里插入图片描述
解压完成后,解压的主目录里面点击A绘世启动器.exe就能启动了。
等待加载后启动完成。
在这里插入图片描述
再点击一键启动,等待程序加载…
在这里插入图片描述
弹出以下网页界面就是启动完成了
在这里插入图片描述
在文生图输入a cat,就会生成一直一张猫的图片。
这是 anything-v5模型下生成的猫图片
在这里插入图片描述
到这里Stable Diffusion就安装完成了。

Stable Diffusion软件配置,插件安装,模型下载

Stable Diffusion Web UI文件夹作用

embeddings文件夹

embeddings是嵌入的意思,意识是一个物体映射到另外一个物体,就是一个关系的桥梁。
主要是用来存放pt格式和safetensors格式的嵌入式像量文件的,比如Easy Negative和bad hands5。

extensions文件夹

放置插件的文件夹,所有Stable Diffusion下载的插件都是放置到这个文件夹下的。

models文件夹

下载的大模型都是放置到这个文件夹下的。

大模型下载

进行civitai下载模型。
主页面选择Models
在这里插入图片描述
然后右边Filters点开,在Model Types里面选择Checkpoint
在这里插入图片描述

然后选择自己喜欢的风格模型下载,等待下载完成即可。
在这里插入图片描述
在这里插入图片描述
把下载好的safetensonrs文件放到主目录的models/stable-diffusion下面
在这里插入图片描述
刷新一下模型就处来了。
在这里插入图片描述
切换模型。

关闭掉后台程序,删掉extensions文件夹下的所有插件,为了保持干净的插件环境。

安装好中文插件后,进入设置/用户界面,选择zh-Hans(Stable),然后再需要下一个主题美化的插件lobe
在这里插入图片描述再重启一下后台程序和重新进入一下界面即可

在这里插入图片描述

Stable Diffusion提示词

提示词原理

提示词基础

1.提示词之间需要使用英文逗号分隔开
2.提示词是可以进行换行的
3.每个提示词的权重默认为1,权靠前权重越高
4.数量控制在75个单词以内

例如提示语输入,girlish,Blonde hair,Blue pupils
就是说生成一个少女,金色的头发,蓝色的眼瞳即可。尽量使用英文作为提示语,使用中文的时候AI有些提示语会无法识别出来。
在这里插入图片描述

符号解释

权重控制

()使用括号括起来的提示词权重会变成原来的1.1倍率,最多套三层
red = 1 ,(red) = 1.1 ,(((red))) = 1.331

{}符号也是添加权重的,{red} = 1.05

[]符号是减少权重的,[red] = 0.9

直接设置权重的方式可以如下
(red:1.5)
(greed:0.3)

如下我们输入
Noodles,Meat,Vegetables,Scallions,Eggs,Fish。然后对鸡蛋的权重进行不同的控制会生成如下不一样的
在这里插入图片描述

Lora文件触发

使用尖括号<>调用Lora
女孩穿着汉服 1GIRL,IN HandFu < LORA:Hanfu:0.6 >
在这里插入图片描述

提示词连接

使用_下划线进行连接
比如一个提示语Coffee Cake,Stable Diffusion会理解成咖啡和蛋糕
但是输入 Coffee_Cake会理解成咖啡蛋糕

进阶语法

[提示语:0-1数值]
FOREST ,LOTS OF TREES AHO STOHES ,[FLOWERS: 0.7]

这里一张图片在生成采样70%以后,才开始计算Flowers的采样
在这里插入图片描述
如果是使用[提示语::0-1数值]双冒号后
FOREST ,LOTS OF TREES AHO STOHES ,[FLOWERS:: 0.7]
意思是计算到70%的采样之后,不在进行Flowers的采样计算,下图
在这里插入图片描述
[提示词1:提示词2:0-1数值]
[STOHES : FLOWERS : 0.70],这句话的意思是前面70%的计算中STOHES生效, FLOWERS则只在后面的30%生效。
在这里插入图片描述

[提示语1|提示语2],则为提示语1和提示语2交替使用采样
输入1Girl,[Red|Blue] Hair,这样就生成一个红蓝交替发色的女孩了

在这里插入图片描述

提示词推荐格式

填写顺序
1,画质+画风词
2,画面主体描述
3,环境、场景、灯光、构图
4,Lora
5,负面词语

画质

画质词如下有:
[masterpiece:1.2),best qualityhighres,extremely detailed CG,perfect lighting,8k wallpaper

画风

真实系:photograph,photorealistic
插画风:lllustration,painting,paintbrush
二次元:anime, comic, game CG,
三维场景:3D,C4D render unreal engine,octane render

画风词:
Cyberpunk 赛博朋克
8bit/16bit pixel 像素风
studio ghibli 宫崎骏风格
pixel style 皮克斯风格
Chinese ink style 水墨画

反向提示词

负面词:NSFW,[worst quality:2),[low quality:2[normal quality:2],lowres, normal quality[[monochrome)),[[grayscale]],skin spots,acnes,skin blemishes, age spot,[ugly:1.331],[duplicate:1.331],[morbid:1.21),[extra legs:1.331],[fused fingers:1.5,(too many fingers:1.5](unclear eyes:1.331],lowers, bad handsmissing fingers,extra digit,bad handsmissing fingers,[llextra arms and legs]]],

上面的负面提示词为通用的,NSFW是告诉Stable Diffusion不要生成适合公共场合的图片,还有就是告诉SD不要生成角色缺手臂,缺一条腿的图片

在这里插入图片描述
这些直接复制到下面的反向提示词即可

prompt-all-in-one插件

下载链接,https://github.com/Physton/sd-webui-prompt-all-in-one

安装这个插件后在红框处输入想要的提示词中文,按一下回车就可以自动生成了英文输入此时写入正向了。
在这里插入图片描述
在这里插入图片描述
对英文不太好的朋友非常的友好。

在这里插入图片描述
而下面又可以找到不同的人物,装饰,服饰等词语。

Stable Diffusion 采样器

采样器主要划分成三大类型
1.老派采样器
2.DPM采样器
3.新派采样器

采样器名单如下
在这里插入图片描述
上面有很对采样器都不好用,而有很多采样器也有升级版本后被淘汰的。
我们只需要使用一些好用采用的采样器即可。

老派采样器

DDIM和PLMS是SD最早的采样器算法,不再进行使用
Euler和Euler a渲染画面简单直接,不容易出错,Eluer后面的a代表这收敛的意思
Heun 画质更好,但速度慢一倍
LMS和MSKarras 线性多步法,速度和Euler差不多,实测没Euler稳定,容易出色块

老派采样器中仅仅使用
Euler,Euler a,Heun

DPM采样器

在这里插入图片描述
DPM fast很不稳定,DPM adaptive算法是时间不可控。
DPM二代算法消耗高
因为Karras结尾的是优化算法,Heun是更清晰化的算法,a是收敛化,2S和2M的区别是2M的算法增加了色块直接的通讯,2M是2S的进阶版本。

剩下推荐的算法为如下
在这里插入图片描述

新派采样器

在这里插入图片描述
在这里插入图片描述

相关链接

CGMI.Com:https://cgmi.com/
ChatGPT-4白给:https://cgmi.com/archives/677
模型下载C站:https://civitai.com/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/671105.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode406:根据身高重建队列

题目描述 假设有打乱顺序的一群人站成一个队列&#xff0c;数组 people 表示队列中一些人的属性&#xff08;不一定按顺序&#xff09;。每个 people[i] [hi, ki] 表示第 i 个人的身高为 hi &#xff0c;前面 正好 有 ki 个身高大于或等于 hi 的人。 请你重新构造并返回输入数…

【高校科研前沿】中国科学院地理资源所钟帅副研究员研究组博士生朱屹东为一作在Top期刊发文:从潜力到利用:探索西藏风能资源开发的技术路径优化布局

01 文章简介 论文名称&#xff1a;From potential to utilization: Exploring the optimal layout with the technical path of wind resource development in Tibet&#xff08;从潜力到利用:探索西藏风能资源开发的技术路径优化布局&#xff09; 文章发表期刊&#xff1a;《…

红日靶场ATTCK 1通关攻略

环境 拓扑图 VM1 web服务器 win7&#xff08;192.168.22.129&#xff0c;10.10.10.140&#xff09; VM2 win2003&#xff08;10.10.10.135&#xff09; VM3 DC win2008&#xff08;10.10.10.138&#xff09; 环境搭建 win7&#xff1a; 设置内网两张网卡&#xff0c;开启…

期权如何开户的流程是什么样的?

今天期权懂带你了解期权如何开户的流程是什么样的&#xff1f;期权账户开户是指投资者向期权经纪商或金融机构提交申请&#xff0c;以便可以在期权市场上进行交易并持有期权合约的账户开设过程。 期权如何开户的流程是什么样的&#xff1f; 1. 投资者参与营业部提供的股票期权…

【6D位姿估计】数据集汇总 BOP

前言 BOP是6D位姿估计基准&#xff0c;汇总整理了多个数据集&#xff0c;还举行挑战赛&#xff0c;相关报告被CVPR2024接受和认可。 它提供3D物体模型和RGB-D图像&#xff0c;其中标注信息包括6D位姿、2D边界框和2D蒙版等。 包含数据集&#xff1a;LM 、LM-O 、T-LESS 、IT…

Netty核心线程模型源码分析

文章目录 一、Netty线程模型简介二、Netty线程模型源码分析1. 服务端源码分析 一、Netty线程模型简介 Netty的线程模型图如下所示&#xff1a; 具体细节看这篇博客 二、Netty线程模型源码分析 1. 服务端源码分析 首先我们在写Netty服务端程序的时候最开始是下面两句代码&a…

【JAVA入门】Day03 - 数组

【JAVA入门】Day03 - 数组 文章目录 【JAVA入门】Day03 - 数组一、数组的概念二、数组的定义2.1 数组的静态初始化2.2 数组的地址值2.3 数组元素的访问2.4 数组遍历2.5 数组的动态初始化2.6 数组的常见操作2.7 数组的内存分配2.7.1 Java内存分配2.7.2 数组的内存图 一、数组的概…

ncnn 算子操作描述

ncnn 算子操作描述&#xff0c;具体查询见 ncnn/docs/developer-guide/operators.md at master Tencent/ncnn GitHub 都是从上述地方copy过来的&#xff0c;做备份。 具体如下&#xff1a; 1.AbsVal: 计算输入张量中的每个元素的绝对值。 y abs(x)one_blob_only 只支持…

【Axure高保真原型】动态伸缩信息架构图

今天和大家分享动态伸缩信息架构图的原型模板&#xff0c;我们可以通过点击加减按钮来展开或收起子内容&#xff0c;具体效果可以点击下方视频观看或者打开预览地址来体验 【原型效果】 【Axure高保真原型】动态伸缩信息架构图 【原型预览含下载地址】 https://axhub.im/ax9/…

练习题(2024/5/6)

1路径总和 II 给你二叉树的根节点 root 和一个整数目标和 targetSum &#xff0c;找出所有 从根节点到叶子节点 路径总和等于给定目标和的路径。 叶子节点 是指没有子节点的节点。 示例 1&#xff1a; 输入&#xff1a;root [5,4,8,11,null,13,4,7,2,null,null,5,1], target…

使用ThemeRoller快速实现前端页面风格美化

使用ThemeRoller快速实现前端页面风格美化 文章目录 使用ThemeRoller快速实现前端页面风格美化一、ThemeRoller二、使用方法1.基本操作面板介绍2.直接用现成的配色风格——Gallery画廊3.自定义风格——Roll Your Own4.下载风格包并应用到页面 一、ThemeRoller ThemeRoller是jQ…

基于EWT联合SVD去噪

一、代码原理 &#xff08;1&#xff09;基于EWT-SVD的信号去噪算法原理 经验小波变换&#xff08;Empirical Wavelet Transform&#xff0c;EWT&#xff09;&#xff1a;EWT是一种基于信号局部特征的小波变换方法&#xff0c;能够更好地适应非线性和非平稳信号的特性。奇异值…