【Stable Diffusion】入门-03:图生图基本步骤+参数解读

目录

  • 1 图生图原理
  • 2 基本步骤
    • 2.1 导入图片
    • 2.2 书写提示词
    • 2.3 参数调整
  • 3 随机种子的含义
  • 4 拓展应用

1 图生图原理

当提示词不足以表达你的想法,或者你希望以一个更为简单清晰的方式传递一些要求的时候,可以给AI输入一张图片,此时图片和文字是相当的,都是作为一种信息输送给模型,让它拿来生成一张新的图片。模型可以从图片上获取更多的信息,原本的图片上记录的像素信息会在加噪和去噪的过程里被作为一种特征反映到最终的成品上,会让最后成品跟一开始这张图片足够像,给人一种重新绘制的表象。

2 基本步骤

2.1 导入图片

  1. 点击img2img
  2. 点击左下方区域或者直接将图片拖到左下方,上传图片
    导入图片
    在图生图区块下方,有一系列进阶的功能选项。

2.2 书写提示词

图生图也需要提示词,提示词也很重要,按照上一篇博文书写提示词。

2.3 参数调整

图生图大部分参数和文生图一样,也有些不同的参数。

  1. Denoising strength:重绘幅度,生成图和原图有多像。如果是一键式生成漫画的方式,推荐0.6~0.8。
  2. 图像分辨率:推荐使用原图的尺寸,如果原始尺寸很大,按比例往下折算到自己的设备能画出来的那个安全区间内,宽高比保持一致。如果想生成其他尺寸比例的图片,推荐先用其他软件裁剪成想要的比例再导入。如果设置的宽高比跟原始的不一样,可能会导致画面的变形。
  3. 图片导入区块下方的几个缩放模式可以帮助裁剪一部分。Just resize (latent upscale) 直接缩放(放大潜变量)不推荐使用,对显存要求很高。图片裁剪缩放

3 随机种子的含义

我们在生成图片时,每次的结果都是不同的。如果我们想要当前生成图的人物形象,只修改背景,那是否能做到呢?
AI生成图片是随机的,但每一次生成都有一套描绘方式,这个描绘方式就会被记录成一组随机数,这就叫做随机种子seed。
随机种子
不同的随机种子,出来的效果是随机性强的。如果使用同一个随机种子,那生成的图像里就必然会存在很多的相似之处,因为它是用同一套方法随机出来的。
点击骰子,可以把随机参数设置成-1,就是每次都随机生成一个新图。
点击循环按钮,就会把种子设置成你的上一张图片生成的那个种子数。
图库里找到喜欢的图片对应的种子数,复制出来填到随机种子栏里,再通过提示词,把背景的元素加上,就可以保持人物形象不变,只改变背景,最大程度地保持了人物风格的相对一致。

4 拓展应用

  1. 风格转换:将真实人像转成二次元风格,通过修改提示词变换不同的风格。或者将二次元人物真实化。
  2. 拟人化:将不是人像的图片导入,以人物属性的提示词对他进行描述,可以实现静物和风景的拟人化。
  3. 图片细化:通过ps等软件搭建简单的框架,或者乱涂乱画,再借助图生图重绘成炫酷的画面效果。简图
    生成图

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/540439.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux 部署 Samba 服务

一、Ubuntu 部署 Samba 1、安装 Samba # 更新本地软件包列表 sudo apt update# 安装Samba sudo apt install samba# 查看版本 smbd --version2、创建共享文件夹,并配置 Samba 创建需要共享的文件夹,并赋予权限: sudo mkdir /home/test sud…

2.4G合封芯片 XL2407P,收发一体

XL2407P芯片是工作在2.400~2.483GHz世界通用 ISM 频段,集成微控制器的的 2.4G合封芯片。该芯片集成射频收发机、频率收生器、晶体振荡器、调制解调器等功能模块,可以大大减少外围元件数量,节省空间,降低系统复杂度。XL2407P合封的…

图片压缩神器源码系统:无损画质 带完整的代码安装包以及搭建教程

在数字化时代,图片已经成为我们日常生活和工作中不可或缺的一部分。然而,随着图片数量的增加和质量的提升,存储空间的问题也日益凸显。如何在保证图片质量的前提下,有效减少图片的大小,成为了一个亟待解决的问题。罗峰…

如何布局马斯克推特上喊的meme币赛道

2024年的牛市正如火如荼的开展,截止当下,比特币已经站上了7.3万美元,远超2021年高点的6.9万美元,比特币的未来是一片大海。 除了比特币的一枝独秀之外,meme板块可以说是市场资金最青睐的。尤其是马斯克在X分享PEPE相关…

JVM 面试——G1和ZGC的区别

ZGC是一款JDK 11中新加入的具有实验性质的低延迟垃圾收集器ZGC的目标主要有4个 支持TB量级的堆。我们生产环境的硬盘还没有上TB呢,这应该可以满足未来十年内,所有JAVA应用的需求了吧。最大GC停顿时间不超10ms。目前一般线上环境运行良好的JAVA应用Minor …

专题二 - 滑动窗口 - leetcode 76. 最小覆盖子串 | 困难难度

leetcode 76. 最小覆盖子串 leetcode 76. 最小覆盖子串 | 困难难度1. 题目详情1. 原题链接2. 基础框架 2. 解题思路1. 题目分析2. 算法原理3. 时间复杂度 3. 代码实现4. 知识与收获 leetcode 76. 最小覆盖子串 | 困难难度 1. 题目详情 给你一个字符串 s 、一个字符串 t 。返回…

如何在Windows11中安装Multipass并启动一个Ubuntu22的虚拟机(以失败告终)

使用了很长时间的VMWare,感觉没有什么特别不好的。不过由于最近需要做uniapp开发,这玩意在Windows中适配的最好,这个时候用VMWare虚拟机就不合适了。但是,我又要在Win11中写uniapp的代码,又要写Python的代码&#xff0…

结构体之成绩统计2

题目描述 有N个学生,每个学生的数据包括学号、姓名、3门课的成绩,从键盘输入N个学生的数据,要求打印出3门课的总平均成绩,以及最高分的学生的数据(包括学号、姓名、3门课成绩) 输入格式 学生数量N占一行每个学生的学号、姓名、三科成绩占一行,空格分开。 输出格式 各门…

操作系统总结(第二周 第一堂)

前言: 第一周的重点就在于一张图表: 基于这张图,我们将陷入内核分为了两个大块Trap和Interrupt。同时我们知道一件事情任何一次I/O操作或者错误程序操作都将陷入内核,从而使得内核可以监控所有的外部设备以及维护整个电脑程序运行…

柜面服务能力演讲及岗位技能大赛活动方案

为提升柜面服务能力及员工专业能力,助力业务发展,聚力推进“柜面焕新升级”活动,进一步为销售一线提供及时、高效、顺畅、快捷的服务支持,省公司将组织开展“凝聚你我力量,共助业务发展”演讲及岗位技能大赛活动&#…

C语言——动态内存分配

前言:通过前面的学习,我们知道C语言中在内存中开辟空间的方法有:变量和数组。既然拥有了开辟空间的方法,我们为什么还要学习动态内存分配呢? int val 20; //在内存中开辟四个字节的空间 int arr[10] { 0 }; //在内…

如何在Linux部署DataEase数据分析服务并实现无公网IP远程分析内网数据信息

文章目录 前言1. 安装DataEase2. 本地访问测试3. 安装 cpolar内网穿透软件4. 配置DataEase公网访问地址5. 公网远程访问Data Ease6. 固定Data Ease公网地址 前言 DataEase 是开源的数据可视化分析工具,帮助用户快速分析数据并洞察业务趋势,从而实现业务…