huggingface学习|controlnet实战:云服务器使用StableDiffusionControlNetPipeline生成图像

ControlNet核心基础知识

文章目录

  • 一、环境配置和安装需要使用的库
  • 二、准备数据及相关模型
  • 三、参照样例编写代码
    • (一)导入相关库
    • (二)准备数据(以知名画作《戴珍珠耳环的少女》为例)
    • (三)将这张图片交给Canny Edge边缘提取器进行预处理
    • (四)图像生成
  • 四、完整代码


一、环境配置和安装需要使用的库

1.创建并激活环境

conda create -n controlnet python=3.8
conda activate controlnet

2.安装需要的库

pip install opencv-python transformers accelerate
pip install diffusers
pip install xformers

二、准备数据及相关模型

  1. 下载图像数据:知名画作《戴珍珠耳环的少女》
  2. 下载controlnet模型:lllyasviel/sd-controlnet-canny
  3. 下载stable-diffusion-v1-5模型runwayml/stable-diffusion-v1-5(可以换成别的)

模型下载的方式:采用git远程clone下来,具体方式可以参考之前的内容:huggingface学习 | 云服务器使用git-lfs下载huggingface上的模型文件;

三、参照样例编写代码

(一)导入相关库

from diffusers import StableDiffusionControlNetPipeline, ControlNetModel, UniPCMultistepScheduler
from diffusers.utils import load_image
import numpy as np
import torchimport cv2
from PIL import Image

(二)准备数据(以知名画作《戴珍珠耳环的少女》为例)

  1. 可以直接从huggingface官网加载图片:
# download an image
image = load_image("https://hf.co/datasets/huggingface/documentation-images/resolve/main/diffusers/input_image_vermeer.png"
)
image = np.array(image)
  1. 也可以从本地读取图片:
# download an image
image_path="./input_image_vermeer.png"
image=Image.open(image_path)
image = np.array(image)

在这里插入图片描述

(三)将这张图片交给Canny Edge边缘提取器进行预处理

# get canny image
image = cv2.Canny(image, 100, 200)
image = image[:, :, None]
image = np.concatenate([image, image, image], axis=2)
canny_image = Image.fromarray(image)canny_image.save("./controlnet_result0.png")

边缘提取预处理之后的效果如下图所示:
在这里插入图片描述

(四)图像生成

  1. 导入runwaylml/stable-diffusion-v1-5模型以及能够处理Canny Edge的ControlNet模型
controlnet = ControlNetModel.from_pretrained("./sd-controlnet-canny", torch_dtype=torch.float16)
pipe = StableDiffusionControlNetPipeline.from_pretrained("./stable-diffusion-v1-5", controlnet=controlnet, torch_dtype=torch.float16
)
  1. 使用当前速度最快的扩散模型调度器-UniPCMultistepScheduler,迭代20次就可以达到之前默认调度器50次迭代的效果
# speed up diffusion process with faster scheduler and memory optimization
pipe.scheduler = UniPCMultistepScheduler.from_config(pipe.scheduler.config)
# remove following line if xformers is not installed
pipe.enable_xformers_memory_efficient_attention()pipe.enable_model_cpu_offload()
  1. 生成最终图像
generator = torch.manual_seed(0)
image = pipe("futuristic-looking woman", num_inference_steps=20, generator=generator, image=canny_image
).images[0]
image.save("./controlnet_result1.png")

最终生成的效果图如下所示:
在这里插入图片描述

四、完整代码

from diffusers import StableDiffusionControlNetPipeline, ControlNetModel, UniPCMultistepScheduler
from diffusers.utils import load_image
import numpy as np
import torchimport cv2
from PIL import Image# download an image
image_path="./input_image_vermeer.png"
image=Image.open(image_path)
image = np.array(image)# get canny image
image = cv2.Canny(image, 100, 200)
image = image[:, :, None]
image = np.concatenate([image, image, image], axis=2)
canny_image = Image.fromarray(image)canny_image.save("./controlnet_result0.png")# load control net and stable diffusion v1-5
controlnet = ControlNetModel.from_pretrained("./sd-controlnet-canny", torch_dtype=torch.float16)
pipe = StableDiffusionControlNetPipeline.from_pretrained("./stable-diffusion-v1-5", controlnet=controlnet, torch_dtype=torch.float16
)# speed up diffusion process with faster scheduler and memory optimization
pipe.scheduler = UniPCMultistepScheduler.from_config(pipe.scheduler.config)
# remove following line if xformers is not installed
pipe.enable_xformers_memory_efficient_attention()pipe.enable_model_cpu_offload()# generate image
generator = torch.manual_seed(0)
image = pipe("futuristic-looking woman", num_inference_steps=20, generator=generator, image=canny_image
).images[0]
image.save("./controlnet_result1.png")

参考:
Huggingface中ControlNet pipeline介绍
扩散模型实战(十三):ControlNet结构以及训练过程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/511396.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

web小游戏,蜘蛛纸牌

H5小游戏源码、JS开发网页小游戏开源源码大合集。无需运行环境,解压后浏览器直接打开。有需要的订阅后,私信本人,发源码,含60+小游戏源码。如五子棋、象棋、植物大战僵尸、贪吃蛇、飞机大战、坦克大战、开心消消乐、扑鱼达人、扫雷、打地鼠、斗地主等等。 <!DOCTYPE h…

Docker Protainer可视化平台,忘记登录密码,重置密码。

由于好久没有登录portainer系统&#xff0c;导致忘记了登录密码&#xff0c;试了好多常用的密码都不对&#xff0c;无奈只能重置密码。 一、停止protainer 容器 查看容器ID和COMMAND 用于停止容器 docker ps -a停止容器 docker stop portainer二、查找volume data 宿主机所在…

时间序列分析技巧(一):根据ACF、PACF进行AR、MA、ARMA模型选择

程序员如何选择职业赛道&#xff1f; &#x1f349;CSDN小墨&晓末:https://blog.csdn.net/jd1813346972 个人介绍: 研一&#xff5c;统计学&#xff5c;干货分享          擅长Python、Matlab、R等主流编程软件          累计十余项国家级比赛奖项&#…

华为OD机试 - 数字排列 - 深度优先搜索dfs算法(Java 2024 C卷 100分)

目录 专栏导读一、题目描述二、输入描述三、输出描述1、输入2、输出3、说明 四、解题思路五、Java算法源码六、效果展示1、输入2、输出3、说明 华为OD机试 2024C卷题库疯狂收录中&#xff0c;刷题点这里 专栏导读 本专栏收录于《华为OD机试&#xff08;JAVA&#xff09;真题&a…

LeetCode每日一题之 复写0

目录 题目介绍&#xff1a; 算法原理&#xff1a; 特殊位置处理&#xff1a; 代码实现&#xff1a; 题目介绍&#xff1a; 题目链接&#xff1a;. - 力扣&#xff08;LeetCode&#xff09; 算法原理&#xff1a; 这种对数组元素进行修改&#xff0c;移动的题目我们仍然可以…

Unity之街机捕鱼

目录 &#x1f62a;炮台系统 &#x1f3b6;炮口方向跟随鼠标 &#x1f3b6;切换炮台 &#x1f62a;战斗系统 &#x1f3ae;概述 &#x1f3ae;单例模式 &#x1f3ae;开炮 &#x1f3ae;子弹脚本 &#x1f3ae;渔网脚本 &#x1f3ae;鱼属性信息的脚本 &#x1f6…

【探索AI】二十一 深度学习之第4周:循环神经网络(RNN)与长短时记忆(LSTM)

循环神经网络&#xff08;RNN&#xff09;与长短时记忆&#xff08;LSTM&#xff09; RNN的基本原理与结构LSTM的原理与实现序列建模与文本生成任务实践&#xff1a;使用RNN或LSTM进行文本分类或生成任务步骤 1: 数据准备步骤 2: 构建模型步骤 3: 定义损失函数和优化器步骤 4: …

【系统架构设计师考试大纲】

曾梦想执剑走天涯&#xff0c;我是程序猿【AK】 目录 简述概要知识图谱考试目标考试要求考试题目题型分析计算机基础知识&#xff08;20%&#xff09;信息化战略与规划&#xff08;9%&#xff09;软件工程&#xff08;25%&#xff09;系统架构设计&#xff08;35%&#xff09;信…

视觉基本数据和基线代码获取

机器视觉相关网站推荐 - 知乎 1. 搜benchmark, 视觉相关的&#xff0c;任何一个行业&#xff0c;只要是一个大众的&#xff0c;都有自己的benchmark. 一般都会有自己的数据集和相应的代码。很多benchmark都会帮我们搜集优秀的代码和数据集。 http://shuoyang1213.me/WIDERFA…

Linux 驱动 中断(一)

中断是指计算机运行过程中&#xff0c;出现某些意外情况需主机干预时&#xff0c;机器能自动停止正在运行的程序并转入处理新情况的程序&#xff0c;处理完毕后又返回原被暂停的程序继续运行。 在 Linux 中&#xff0c;中断处理是操作系统与硬件设备之间通信的重要方式之一。Li…

FT4222模块树莓派使用

关于FT4222设备 FT4222是一款功能强大的USB到SPI/I2C/GPIO的转接器桥&#xff0c;由芯片制造商FTDI&#xff08;Future Technology Devices International Ltd.&#xff09;开发和生产。该模块可以将USB接口转换为SPI&#xff0c;I2C接口或GPIO接口&#xff0c;从而方便地连接…

Fantasy UI

有了这个包&#xff0c;你可以获得一个完整的幻想rpg游戏ui的psd源文件。 下载&#xff1a;​​Unity资源商店链接资源下载链接 效果图&#xff1a;