Stable Diffusion WebUI 生成参数:宽度/高度/生成批次/每批数量/提示词相关性/随机种子

在这里插入图片描述

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。

大家好,我是水滴~~

本文将继续了解 Stable Diffusion WebUI 的生成参数,主要内容有:宽度、高度、生成批次、每批数量、提示词相关性、随机种子。希望能对你有所帮助。

文章目录

  • 宽度(Width)和高度(Height)
  • 生成批次(Batch count)
  • 每批数量(Batch size)
  • 提示词相关性(CFG Scale)
  • 随机种子(Seed)


宽度(Width)和高度(Height)

在 Stable Diffusion WebUI 中,宽度和高度用于定义生成图片的大小,也就是分辨率,单位为像素,默认为:512×512。

在这里插入图片描述

对于 SD1.5,输出在 512×512 像素左右进行优化。常见纵横比的最佳分辨率通常是:

  • 1:1(方形):512×512、768×768
  • 3:2(横向):768×512
  • 2:3(纵向):512×768
  • 4:3(横向):768×576
  • 3:4(纵向):576×768
  • 16:9(宽屏):912×512
  • 9:16(高):512×912

对于 SDXL,输出在 1024x1024 像素左右进行优化。常见纵横比的最佳分辨率通常是:

  • 1:1(方形):1024×1024、768×768
  • 3:2(横向):1152×768
  • 2:3(纵向):768×1152
  • 4:3(横向):1152×864
  • 3:4(纵向):864×1152
  • 16:9(宽屏):1360×768
  • 9:16(高):768×1360

设置宽度和高度的要求是必须是 8 的倍数。如果想要生成更高像素的图片,建议不要直接调高分辨率,而是使用高分辨率修复,或者使用放大器。

生成批次(Batch count)

生成批次指的是每次运行 Stable Diffusion WebUI 生成图像的组数。通过调整生成批次,可以控制生成图片的数量。具体的生成图像数量 = 生成批次 × 每批数量

下图将【生成批次】设为 6,可以看出右侧输出了 6 张图片(第 1 张图片是它们的宫格图):

在这里插入图片描述

注意:这 6 张图不是同时生成的,而是生成完一个再生成下一个,不会增加显存负担。

每批数量(Batch size)

每批数量是指同时生成多少个图像。增加这个值可以提高算法的性能,但也需要更多的显存。

下图将【生成批次】还原为 1,【每批数量】设为 6,可以看出右侧也输出了 6 张图片:

在这里插入图片描述

需要注意的是,较大的每批数量会消耗更多的显存,因此在显存有限的情况下,建议将每批数量保持为较低的值,以避免显存不足的问题。

下图将【生成批次】和【每批数量】都设为 2,可以看出右侧输出了 4 张图片:

在这里插入图片描述

提示词相关性(CFG Scale)

在 Stable Diffusion 中,CFG(Classifier Free Guidance)表示为无分类器信息引导规模。CFG 是控制稳定扩散应遵循文本提示的紧密程度的设置,即提示词相关性。

在这里插入图片描述

理论上,CFG 值越高,它就越严格地遵循您的提示。默认值为 7,它在创作自由度和遵循您的方向之间提供了良好的平衡。值为 1 将使 Stable Diffusion 几乎完全自由,而高于 15 的值则相当受限制。

使用 CFG 来控制 Stable Diffusion 跟随文本提示的紧密程度听起来很简单,但遗憾的是 Stable Diffusion 并不是那么简单。不同的 CFG 值会带来一些权衡。为了演示它们,这里有一个使用 Euler A 采样器和 20 个采样步数的具体示例:

在这里插入图片描述

从这个例子中你可以注意到一些事情:

  • 色彩饱和度随着 CFG 的增加而增加
  • 对比度随着 CFG 的增加而增加
  • 高于某个 CFG 值时,输出图像会变得更加模糊,导致细节丢失

为了抵消较高 CFG 值时输出图像质量的下降,您通常可以执行以下两项操作:

  • 增加采样器步数:一般经验法则是,采样器步数越多,输出图像的细节就越多,尽管与 CFG 一样,该规则仅适用于特定阈值。请记住,更多的采样器步骤通常会导致更长的处理时间。
  • 更改采样器方法:一些采样器是专门为在较低或较高的 CFG 和采样步骤下最佳运行而开发的。例如,UniPC 可以在 CFG 低至 3 时返回良好的结果,但通常会在 CFG 为 10 左右时看到质量下降。另一方面,DPM++ SDE Karras 通常在 CFG 值大于 7 时产生大量图像细节。

为了获得最佳的输出图像,同时最大限度地减少内存和处理时间,用户需要在 CFG、采样器和采样步数之间找到平衡。

随机种子(Seed)

随机种子是用于初始化模型随机性的数字。通过设置种子,您每次都可以获得相同的输出。

在这里插入图片描述

如果您找到喜欢的图像但想要调整它或提高质量,您可以使用相同的种子,然后进行高分辨率修复。

在生成图后,可以点击“绿色循环箭头”图标来使用上次生成的图片的种子;如果想继续随机生成,可以点击“筛子”图标,或直接将随机种子设为 -1。

在这里插入图片描述

注意:如果您有固定的种子但更改图像的宽度、高度、提示词等信息,那么您将不会看到一致的结果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/549132.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【目标检测】YOLOv2 网络结构(darknet-19 作为 backbone)

上一篇文章主要是写了一些 YOLOv1 的原版网络结构,这篇文章一样,目标是还原论文中原版的 YOLOv2 的网络结构,而不是后续各种魔改的版本。 YOLOv2 和 YOLOv1 不一样,开始使用 Darknet-19 来作为 backbone 了。论文中给出了 Darkne…

jupyter notebook使用教程

首先是打开jupyter notebook 下载安装好之后,直接在命令行中输入‘jupyter notebook’即可跳转到对应页面 还可以进入想要打开的文件夹,然后再文件夹中打开中断,执行‘jupyter notebook’命令,就能够打开对应文件界面的jupyter …

关于前端的学习

目录 前言: 1.初识HTML: 1.1超文本: 1.2标记语言: 2.关于html的基本框架: 3.HTML基本文字标签: 3.1.h标题标签: 3.3 文本内容: 3.4换行的和分割的: 3.5 特殊文字标签: 3.5.1表面上看着三对的结果呈现都是一样的: 3.5.2但是其背后的效果其实是不一样的: 3.6转义字符:…

25考研|北大软微会「爆炸」吗?

软微不是已经爆炸了吗? 大家去看看他的录取平均分就知道了,没有实力千万别碰,现在考软微已经不存在捡漏之说。 110408的复试线已经划到了465分,这个人真的不低了,因为有数学一和408两个比较难的专业课,复…

Docker之大鲸鱼

什么是Docker? Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化。 Docker常见命令? docker run -d \--name mys…

【GIS系列】GeoTools简介及工具类分享

本文将对GeoTools相关概念进行介绍,同时会给大家分享我工作中用到的工具类及使用方法。 作者:后端小肥肠 目录 1.前言 2. GeoTools简介 3. Geotools使用示例 3.1. 开发环境搭建 3.1.1. 所需版本和工具 3.1.2. pom依赖​​​​​​​ 4. 工具类介绍…

擂台赛-安全攻防之使用openssh后门获取root密码实战

前言 大家好,我是沐风晓月,我们开始组队学习了,介绍下我们的情况: 这几天跟队员 迎月,虹月,心月,古月打擂台,我和心月一组,相互攻占对方服务器。 终于在今早凌晨三点拿…

【算法】欧拉筛(线性筛)模版

蓝桥杯题目 试题 B: 双子数 本题总分:5 分 【问题描述】   若一个正整数 x 可以被表示为 p2 q2,其中 p、q 为质数且 p , q,则 x 是一个 “双子数”。请计算区间 [2333, 23333333333333] 内有多少个 “双子数”? 【答案提交】…

【目标检测】2. RCNN

接上篇 【目标检测】1. 目标检测概述_目标检测包括预测目标的位置吗?-CSDN博客 一、前言 CVPR201 4经典paper:《 Rich feature hierarchies for accurate object detection and semantic segmentation》,https://arxiv.org/abs/1311.2524, 这篇论文的算法思想被称…

Css提高——calc函数、过渡

1、calc函数&#xff1a; 2、过渡 例子 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>过渡exerci…

智能合约 - ERC20介绍

什么是ERC20 ERC20全称为Ethereum Request for Comment 20&#xff0c;是一种智能合约标准&#xff0c;用于以太坊网络上的代币发行 姊妹篇 - 如何部署ERC20 ERC20的应用场景 代币化资产&#xff0c;例如&#xff1a;USDT 是一种以美元为背书的ERC20代币&#xff0c;每个USDT代…

跳绳计数,YOLOV8POSE

跳绳计数&#xff0c;YOLOV8POSE 通过计算腰部跟最初位置的上下波动&#xff0c;计算跳绳的次数