[论文阅读] ZePo: Zero-Shot Portrait Stylization with Faster Sampling

news/2024/11/14 2:16:40/文章来源:https://www.cnblogs.com/lichunlei/p/18539426

写在前面

原文:ZePo
GitHub:Github ZePo
关键词:肖像风格化、扩散模型、零样本快速生成
阅读理由:对扩散模型的改进,可以实现零样本快速生成图像,学习一下思路以及实验设计
前置知识:LCM以及GithubLCM(找时间写一下),可参考LCM&CM,一致性蒸馏、图像质量评价

速览

WHY

扩散模型的逐步去噪过程减慢了图像生成速度,为了克服这些限制,提出了一种基于扩散模型的无反转肖像风格化框架

WHAT

基于扩散模型的无反转肖像风格化框架,可以最少通过4步完成内容和风格的融合

HOW

提取特征:采用使用了一致性蒸馏技术的一致性模型可以有效地从噪声图像中提取代表性的一致性特征
特征融合:采用风格增强注意力控制技术(a Style Enhancement Attention Control technique),该技术可以实现在目标图像的注意力空间精细地合并内容和风格特征
去除冗余特征:采用特征融合策略(a feature merging strategy)来整合一致特征中的冗余特征,减少注意力控制的计算量
设置定量定性实验

方法

1
4

框架流程介绍:

输入图像,x由编码器编码,在潜在空间内创建一个维度较小的向量z。在潜在空间对z添加噪声得到Zt。丢入LCMs进行一致性特征提取。
在去噪过程中应用提出的SEAC注意力控制机制增强风格特征和去除冗余特征,最后由解码器将我们带回图像空间,产生一个高质量的图像。
去噪过程最少需要4步即可,大大提高了产出速度

亮点

一.一致性特征提取 Consistency Features(蓝色)

给定源图像Xsrc和参考图Xref,预训练的VAE编码器分别将它们编码为潜在代码Zsrc和Zref,之后是一个加噪声的前向过程。最后将噪声隐含代码Ztsrc和Ztref输入到LCMs的噪声预测网络εθ,在εθ的每一个transformer layer l中提取源图像和参考图的特征

二.风格增强注意力控制 Style Enhancement Attention Control

用flˆsrc,flˆref来表示合并的一致性特征。
进入注意力控制机制后,合并的特征分别映射到自注意力模块中的键(KEY)和值(VALUE)特征,SEAC机制的不同之处在于:将源图像和参考图像的键、值特征进行拼接,形成一个统一的键值特征集。另外,对参考图像的键(Kref)乘以一个风格增强系数λ,可以增强风格特征
利用关键特征Ks、Kr与目标图像中的查询特征(Query feature)计算自注意力映射A(a self-attention map A)
2
最后,A与Vs、Vr相乘即可得到最终的输出结果
3
(关于查询特征queryfeature)

实验

定性比较

与基于StyleGAN的方法进行对比,包括JoJoGAN、StyleGAN NADA和DynaGAN
与基于扩散模型的方法进行对比,包括InST、VCT
结果如下
5

定量比较

对现有SOTA方法进行定量比较
这里用到了两种评价方法LPIPs和CLIP
对于定量评估,随机选择10张风格图像和10张内容图像,并为每个基准生成了总共100张样式化图像。ZePo方法在LPIPS和CLIP-IQA指标上均优于其他技术,取得了最佳分数。较低的LPIPS得分表明由保留的内容更优,而较高的CLIP-IQA得分则反映能够合成整体质量更好、视觉吸引力更高的图像的能力。
此外,在基于扩散模型的方法中,ZePo的风格评分最高。
还评估了每种方法所需的微调时间和推理时间。先前的方法需要较长的微调周期,而基于扩散的方法具有较长的推理时间。ZePo框架利用零样本方法消除了额外的微调需求。通过引入Style Enhancement Attention Control,将推理时间减少到约0.6秒,提高了实用性。
6

消融研究 Ablation Study

消融实验是一种科学研究方法,用于确定一个条件或参数对结果的影响程度。 当研究者提出了一个新的方案或方法时,消融实验通过逐一控制一个条件或参数,来观察结果的变化,以确定哪个条件或参数对结果的影响更大。

  • 注意力控制 Attention Control
    7

  • 推理步骤 Inference Steps
    8

  • 一致性特征 Consistency Features
    9
    10

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/832460.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024.11.12 鲜花

P11270 【MX-S5-T4】魔法少女们 题解这世界那么多人 这世界有那么多人 人群里 敞着一扇门 我迷朦的眼睛里长存 初见你蓝色清晨 这世界有那么多人 多幸运 我有个我们 这悠长命运中的晨昏 常让我 望远方出神 灰树叶飘转在池塘 看飞机轰的一声去远乡 光阴的长廊 脚步声叫嚷 灯一亮…

Java代码实现行列转换

本代码想要达到的效果 测试完整代码如下(copy直接运行): public class TestConvert { public static void main(String[] args) { ArrayList<Attribute> sourceList = new ArrayList<>(); for (int i = 0; i < 3; i++) { for (i…

SS241112A. 定向越野(walk)

这道题目要求找到从起点出发遍历所有点并回到起点的最小路径长度,路径必须直角拐弯。文章证明了答案是有理数,并通过直观分析和大胆猜测得出初始方向必须是某一个向量的方向,最终使用状压 DP 解决问题,时间复杂度为 $O(n^4 2^n)$。SS241112A. 定向越野(walk) 题意 给你 \…

第六课 Python之模块

一、模块的介绍 (1)python模块,是一个python文件,以一个.py文件,包含了python对象定义和pyhton语句 (2)python对象定义和python语句 (3)模块让你能够有逻辑地组织你的python代码段。 (4)把相关的代码分配到一个模块里能让你的代码更好用,更易懂 (5)模块能定义函数…

redis集群搭建 - cluster模式

搭建一套redis cluster集群。概述 搭建一套redis cluster集群。架构 192.168.0.21:6379 主 192.168.0.23:6380 从 192.168.0.22:6379 主 192.168.0.21:6380 从 192.168.0.23:6379 主 192.168.0.22:6380 从 修改这三台服务器的host文件(选做) vim /etc/hosts192.168.0.21 node…

推荐一个Elasticsearch ES可视化客户端工具:ES-King

ES-King:开源免费,一个现代、实用的ES GUI客户端,支持多平台。 下载地址:https://github.com/Bronya0/ES-King 功能清单 详尽的集群信息:节点信息、堆内存占用、总内存占用、cpu占用、磁盘占用、网络流量、节点角色、集群健康、5分钟负载、每个节点的字段缓存、段缓存、查…

Kafka怎么配置SASL用户名密码认证

服务端配置(server.properties):# 开启SASL认证 security.protocol=SASL_PLAINTEXT sasl.mechanism=PLAIN# 配置JAAS文件路径 listeners=SASL_PLAINTEXT://localhost:9092 sasl.enabled.mechanisms=PLAIN listener.name.sasl_plaintext.plain.sasl.jaas.config=org.apache.kafk…

数据采集与融合技术第四次实践作业

gitee链接: https://gitee.com/zxbaixuexi/2024scrapy/tree/master/第四次实践 作业①: 1) 使用 Selenium 框架+ MySQL 数据库存储技术路线爬取“沪深 A 股”、“上证 A 股”、“深证 A 股”3 个板块的股票数据信息。 候选网站:东方财富网: http://quote.eastmoney.com/cen…

项目冲刺11.12

这个作业属于哪个课程 计科22级34班这个作业要求在哪里 作业要求这个作业的目标 进行为期七天的项目冲刺并记录前言 本篇博客是项目冲刺的第四篇,七篇博客的汇总如下:博客汇总第一篇博客第二篇博客第三篇博客第四篇博客第五篇博客第六篇博客第七篇博客团队简介队名 拖延是你不…

快速修改kafka的broker配置或topic配置

下载开源的kafka界面客户端KafkaKing:https://github.com/Bronya0/Kafka-King 连接后,双击broker配置,或者双击topic配置:修改好后回车保存就行。有些配置是改不了的。

mysql创建表

创建表 创建表要先选中数据库名 create table 表名(列名 类型)来进行创建,列名可以存在多个,表名和列名不可以一样,想要一样的话就要使用反引号把表名和列名引起来 列名在前面,类型在后面查看所有表 show tables查看当前数据库所有表查看指定表的结构 desc 表名;把表的特…