ComfyUI进阶篇:ComfyUI核心节点(一)

news/2024/10/6 4:19:49/文章来源:https://www.cnblogs.com/LIU-QiuXue/p/18284078

ComfyUI进阶篇:ComfyUI核心节点(一)

前言:

学习ComfyUI是一场持久战。当你掌握了ComfyUI的安装和运行之后,会发现大量五花八门的节点。面对各种各样的工作流和复杂的节点种类,可能会让人感到不知所措。在这篇文章中,我们将用通俗易懂的语言对ComfyUI的核心节点进行系统梳理,并详细解释每个参数。希望大家在学习过程中培养自我思考的能力,真正掌握和理解各个节点的用法与功能。在实践中不断提升自己的技术水平。只有通过不断的探索和总结,才能在面对复杂的工作流时游刃有余。祝大家学习顺利,早日成为ComfyUI的高手!

目录:

一、Load Checkpoint节点

二、Load Checkpoint with config节点

三、CLIP Set Last Layer节点

四、CLIP Text Encode (Prompt)节点

五、KSampler节点

六、Empty Latent image节点

七、VAE Decode节点

八、Save image节点

九、文生图示例工作流

一、Load Checkpoint节点

在ComfyUI中,Load Checkpoint节点是一个非常重要的核心节点。其功能是加载checkpoint大模型,常用的大模型有sd1.0、sd1.5、sd2.0、sd3.0、sdXL等。

1

输入

ckpt_name -> 自行选择在模型网站下载好的大模型(在用WebUI时下载了大模型的可以共享路径文件,节省磁盘空间)

输出

MODEL -> 该模型用于对潜空间图片进行去噪

CLIP -> 该模型用于对Prompt进行编码

VAE -> 该模型用于对潜在空间的图像进行编码和解码

注意:·StableDIffusion大模型(checkpoint)内置有CLIP和VAE模型

·另加载大型模型时,可能会耗费较长时间或占用大量内存,确保系统资源充足,避免因资源不足而导致的加载失败。

  1. Load Checkpoint with config节点

该节点是一个高级的节点,用于加载checkpoint大模型并同时应用config文件中指定的设置。

2

输入:

Config_name -> 指定要加载的检查点文件的路径

Ckpt_name -> 自行选择在模型网站下载好的大模型

输出:

MODEL -> 该模型用于对潜空间图片进行去噪

CLIP -> 该模型用于对Prompt进行编码

VAE -> 该模型用于对潜在空间的图像进行编码和解码

注意:确保checkpoint文件和config文件与当前使用的ComfyUI版本兼容

  1. CLIP Set Last Layer节点

对CLIP进行微调并调整最后一层(Set Last Layer)。该节点用来设置选择CLIP模型在第几层的输出数据,提高模型在目标任务上的表现。

3

输入:

clip -> 接收用于对prompt进行编码的CLIP模型

输出:

CLIP -> 具有新设置的输出层的CLIP模型。

参数:

stop_at_clip_layer -> 设置CLIP模型在第几层进行数据输出

注意:CLIP模型对prompt进行编码的过程中,可以理解为对原始文本进行层层编码,该参数就是选择我们需要的一层编码信息,去引导模型扩散。

  1. CLIP Text Encode (Prompt)节点

该节点用来输入正反向提示词,也就是“文生图”,“文生视频”中“文”的输入位置

4

输入:

clip -> 接收用于对prompt进行编码的CLIP模型

输出:

CONDITIONING -> 将文本信息通过CLIP模型编码,形成引导模型扩散的条件信息

参数:

文本输入框 -> 输入需要模型生成的文本信息,正向提示词及反向提示词

注意:当前prompt仅支持英文的输入,但可通过安装插件实现中文实时翻译

  1. KSampler节点

该节点专门用于逐步减少潜在空间图像中的噪声,改善图像质量和清晰度。

5

输入:

model -> 接收来自大模型的数据流

positive -> 接收经过clip编码后的正向提示词的条件信息(CONDITIONING)

negative -> 接收经过clip编码后的反向提示词的条件信息(CONDITIONING)

latent_image -> 接收潜空间图像信息

输出:

LATENT -> 经过KSampler采样器进行去噪后的潜空间图像

参数:

seed -> 在去除图像噪声过程中使用的随机数种子。种子数有限,影响噪声生成的结果

control_after_generate -> 指定种子生成后的控制方式

fixed代表固定种子,保持不变

increment代表每次增加1

decrement代表每次减少1

randomize代表随机选择种子

steps -> 对潜在空间图像进行去噪的步数。步数越多,去除噪声的效果可能越显著

cfg -> 提示词引导系数,表示提示词对最终结果的影响程度。过高的值可能会产生不良影响。

sampler_name -> 选择的采样器名称,不同的采样器类型可以影响生成图像的效果,大家可以根据需求进行选择和实验

scheduler -> 选择的调度器名称,影响生成过程中的采样和控制策略,推荐配置可提供更好的结果

denoise -> 去噪或重绘的幅度,数值越大,图像变化和影响越显著。在高清修复等任务中,通常使用较小的值以保持图像细节和质量

  1. Empty Latent image节点

该节点用来控制纯噪声的潜空间图像及比例。

6

输出:

LATENT -> 输出指定形状和数量的潜空间图像

参数:

width -> 要生成潜空间图像的宽度

height -> 要生成潜空间图像的高度

batch_size -> 需要生成多少张潜空间图像

注意:sd1.0、sd1.5等模型来说最佳尺寸为512*512

sd2.0、sd3.0等模型来说最佳尺寸为1024*1024

  1. VAE Decode节点

该节点用来将潜空间图像解码到像素级的图像。

7

输入:

samples -> 接收经过 KSampler 采样器处理后的潜在空间图像, 用于后续的处理或展示

vae -> 接收用于解码潜在空间图像的 VAE 模型, 大部分情况下,模型的检查点(checkpoint)会包含 VAE,当然也可以单独加载一个VAE模型

输出:

IMAGE -> 输出经过 VAE 解码后可直接查看的图像

  1. Save image节点

该节点用来保存image图像

8

输入:

images -> 保存图像

Tips:一般保存的图像会在你的ComfyUI文件夹中(eg:安装盘:\Comfyui\ComfyUI\output )

  1. 文生图示例工作流

熟悉以上所有节点之后,你就可以搭建第一个“文生图”工作流了

161671a411bdfb3d7d73da7c6e84832

这里使用了sd1.5的大模型,所以latent图像设置512*512,正向提示词输入1 girl,反向提示词输入NSFW避免出现不能播的内容,采样器KSampler使用默认设置,最终出图如下:

10

孜孜以求,方能超越自我。坚持不懈,乃是成功关键。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/738822.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

springboot实现登录demo

springboot,Jwt认证,登录实现简单的登录功能 实体类 定义实体类为User3类。 使用@Data:提供类的get,set,equals,hashCode,canEqual,toString方法; 使用@AllArgsConstructor:提供类的全参构造 使用@NoArgsConstructor:提供类的无参构造 类代码如下 @Data @AllArgsCon…

csv 导出工具

csv 导出工具一般大数据量导出 都会选择 csv 格式,就是存文本格式,相比excel 轻量级,同样数据量 csv 文件更小。工具类,分页导出 /*** Author: lyc* Date: 2024/07/05 16:27*/ @Slf4j public class CsvUtils {/*** 大数量导出** @param fileName 生成文件地址* @para…

虚拟ECU:纯电动汽车发展下的新选择

​人类文明的进步是一个不断自我否定、自我超越的过程。21世纪以来,随着科技进步和经济社会发展,能源和交通系统已从独立于自然环境的孤立系统,转变为与自然、技术、社会深度耦合的复杂系统。为实现可持续发展和应对气候变化,世界各国都在积极推进能源结构调整和技术创新,…

Python多线程-线程池ThreadPoolExecutor

1. 线程池 不是线程数量越多,程序的执行效率就越快。线程也是一个对象,是需要占用资源的,线程数量过多的话肯定会消耗过多的资源,同时线程间的上下文切换也是一笔不小的开销,所以有时候开辟过多的线程不但不会提高程序的执行效率,反而会适得其反使程序变慢,得不偿失。 为…

一个用来画拉氏图的简单Python脚本

这里我提供了一个用于画拉氏图的Python脚本源代码,供大家免费使用。虽然现在也有很多免费的平台和工具可以用,但很多都是黑箱,有需要的开发者可以直接在这个脚本基础上二次开发,定制自己的拉氏图绘制方法。技术背景 关于拉氏图的更多介绍,可以参考下这篇博客,这里简单引述…

如何实现超大场景的三维模型(3D)轻量化

三维工厂K3DMaker是一款三维模型浏览、分析、轻量化、顶层合并构建、几何校正、格式转换、调色裁切等功能专业处理软件。可以进行三维模型的网格简化、纹理压缩、层级优化等操作,从而实现三维模型轻量化。轻量化压缩比大,模型轻量化效率高,自动化处理能力高;采用多种算法对…

HP惠普笔记本使用问题和开启TPM

HP电脑使用 开机按F10,进入BIOS,如果是英文,切换到 Advanced,选择 Display Language,选择 简体中文然后返回上一页,切换到 安全引导配置 选择“启用传统支持和禁用安全引导”,然后F10 保存退出 开机+ESC是进入主菜单,可以从这里选择,进入引导 HP电脑在桌面使用快捷键…

Mysql之基本操作(库,表,用户管理)

库中有表,表中有数据 一、查看帮助信息点击查看代码 mysql> help create //help 后面跟上具体命令可以查看帮助二、查看支持的字符集点击查看代码 show charset; //查看支持的字符集 默认拉丁文字 latin1utf8 | UTF-8 Unicode //阉割版的 utf8mb4 | UTF-8 Unicode …

海康SDK报错Structure.getFieldOrder()

就是你调用的这个结构体以及其引用的其他结构体,可能没有getFieldOrder()的方法,你只要按照顺序把他填上去就好了。比如 public static class NET_DVR_TIME extends Structure {//校时结构参数public int dwYear; //年public int dwMonth; //月public int dwDa…

数字证书的应用场景有哪些?

在当今数字化飞速发展的时代,数字证书作为保障信息安全和身份认证的重要工具,发挥着越来越关键的作用。那么,数字证书究竟在哪些场景中得到了广泛的应用呢? 一、电子商务领域 在电子商务交易中,数字证书确保了交易双方的身份真实性和交易数据的完整性、保密性。例如,当消…

jenkins引用多个maven配置

普通项目都是用maven打包,有个特殊的项目是用到单独本地的maven库。 jenkins配置maven构建选项选择对应的maven名称即可本帖子也是纯手工制作,转载请标明出处-----------burukku(づ。◕ᴗᴗ◕。)づ

Java EE改名Jakarta EE,jakarta对程序的影响

Spring Framework作为Java领域最为流行的框架,有非常庞大的用户群体和项目应用,Java开源框架里绝对的TOP1。我们首先看看Java EE更名Jakarta对Spring Framework的影响。Spring Framework 6正式发布,携JDK 17&Jakarta EE开启新篇章,Spring Framework为何一跃将JDK的base…