Stable diffusion(一)

Stable diffusion 原理解读

名词解释
  • 正向扩散(Fixed Forward Diffusion Process):
  • 反向扩散(Generative Reverse Denoising Process)
    在这里插入图片描述
  • VAE(Variational AutoEncoder):一个用于压缩图片的神经网络,按照我的理解,通过这个模组的图片/文本,将被映射更加精确的向量。
  • Latent Space(潜变量空间):被VAE压缩/升维后的向量。
  • Unet:一个用来预测噪声的图像分割模型
  • CLIP:Tokenizer + Text Encode
  • Sampler:控制迭代次数和迭代总数的规划期。可以有线性规划等规划方式,去分配,在训练中,每一个epoch中加入多少次噪音。
    • 迭代次数:epoch
    • 迭代总数:要加多少次噪音。
Unet原理分析
  1. 图像分割的几种分类。图像分割,就是将像素点达标成thing的过程。
    在这里插入图片描述
  2. 网络结构
    网络结构就是卷积下采样 + 反卷积/反池化 上采样的过程
    在这里插入图片描述
  3. 训练集样例
    在这里插入图片描述
  4. Unet 在stable diffusion中的使用。Unet是用于图像分割的,用于预测像素的分类。在stable diffusion中,就使用它预测噪声,去除噪声。
    1. 在一张图像中,加入随机生成噪声,并且将这张图片和这个噪声分类放到训练集中去。那么就可以通过一张图片,获得有很多图片的训练集。
      在这里插入图片描述
    2. 训练Unet,将图片中的噪音点打标出来。输入图片,输出噪音。并且将噪音去除,就能从一个噪音图片中还原出一个图像~
图生图/文生图
  1. 将图片压缩成潜在变量/在潜在空间中latent space中随机生成一个噪音图片
  2. 加入随机噪声/文生图略
  3. Unet 预测噪声、去噪
  4. 生成新的图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/526764.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

快速上手:使用Hexo搭建并自定义个人博客

🌟 前言 欢迎来到我的技术小宇宙!🌌 这里不仅是我记录技术点滴的后花园,也是我分享学习心得和项目经验的乐园。📚 无论你是技术小白还是资深大牛,这里总有一些内容能触动你的好奇心。🔍 &#x…

再探再报 除 0 这件事有不同

首先,在数学中,一个数除以0是没有意义的。 其次,在计算机中,对于除零,传统概念里是会上报一个异常。首先是CPU内部实现会报异常。最早学组成原理和汇编的时候,都是说CPU寄存器中有个表示除零异常的位。在L…

上位机图像处理和嵌入式模块部署(qmacvisual二维码识别)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 如果说条形码在商品上使用比较多的话,那么二维码识别是一个更加使用频繁的场合。为什么使用这样频繁,我想很多一部分原因来…

渗透测试——信息收集

信息收集 前言 信息收集是在做渗透时找尽可能的多的信息,为之后的渗透做铺垫。信息收集的方法有很多 比如,页面、真实的IP、域名/子域名、敏感目录/文件、端口探测、CMS指纹识别、操作系统识别 1. 页面信息收集 拿到域名后,从网站的url中…

Bee Mobile组件库重磅升级

Bee Mobile组件库重磅升级! 丰富强大的组件移动预览快速上手create-bee-mobile Bee Mobile组件库重磅升级! Bee Mobile组件库最新 v1.0.0 版本,支持最新的 React v18。 主页:Bee Mobile 丰富强大的组件 一共拥有50多个组件&…

基于javaweb+springboot开发的城市地名地址信息管理系统设计和实现

基于javaweb(springboot)城市地名地址信息管理系统设计和实现 博主介绍:多年java开发经验,专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域 作者主页 央顺技术团队 Java毕设项目精品实战案例《1000套》 欢迎点赞 收藏 ⭐留言…

一切都在变好

(1)规模复杂性Hold不住了 我已经说过多次,有几个: 1、5400多只股票,还会再持续增加 2、2.2亿账户,每年还以1600万在增加 3、60-90万亿市值 4、每天6000亿-万亿交易额,看趋势还在增加 也就是说&a…

时间序列-AR MA ARIMA

一、AR模型(自回归) AR探索趋势和周期性 预测依赖于过去的观测值和模型中的参数。模型的阶数 p pp 决定了需要考虑多少个过去时间点的观测值。 求AR模型的阶数 p和参数 ϕ i \phi_i ϕi​ ,常常会使用统计方法如最小二乘法、信息准则(如AIC、BIC&#xf…

开源的Java图片处理库介绍

在 Java 生态系统中,有几个流行的开源库可以用于图片处理。这些库提供了丰富的功能,如图像缩放、裁剪、颜色调整、格式转换等。以下是几个常用的 Java 图片处理库的介绍,包括它们的核心类、主要作用和应用场景,以及一些简单的例子…

加密流量分类torch实践4:TrafficClassificationPandemonium项目更新

加密流量分类torch实践4:TrafficClassificationPandemonium项目更新 更新日志 3/10号更新 流量预处理更新 增加了基于splitCap.exe分流预处理,并且除了提取负载与包长序列后,支持提取统计特征(26维度)。 26维度统计…

表单进阶(3)-上传文件和隐藏字段

上传文件&#xff1a;<input type"file"> 隐藏字段&#xff1a;<input type"hidden" name"" id"" value"带给后端的信息"> 禁用disabled&#xff1a;<button disabled"disabled">注册</bu…

UDP与TCP:了解这两种网络协议的不同之处

&#x1f90d; 前端开发工程师、技术日更博主、已过CET6 &#x1f368; 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 &#x1f560; 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 &#x1f35a; 蓝桥云课签约作者、上架课程《Vue.js 和 E…