LAPGAN浅析

LAPGAN

引言

在原始 GAN和CGAN中,还只能生成 16*16, 28*28, 32*32 这种低像素小尺寸的图片。而LAPGAN首次实现 64*64 的图像生成。与其一下子生成这么大的图像 (包含信息量这么多),不如一步步由小到大,这样每一步生成的时候,可以基于上一步的结果,而且还只需要“填充”和“补全”新图片所需要的那些信息。

LAPGAN的思想

LAPGAN通过级联方式改进GAN以实现从粗略到精细图片的生成。网络的级联思想对后续的研究产生了极大的影响。LAPGAN使用高斯金字塔进行下采样,使用拉普拉斯金字塔进行上采样

假设图像 I I I的长度和宽度均为 j j j,对于图像 I 0 = ( j , j ) I_0=(j,j) I0=(j,j),下采样得到的图像尺寸为( j / 2 , j / 2 ) j/2,j/2) j/2,j/2),上采样得到的图像尺寸为(2 j j j,2 j j j)。对于图像进行连续 k k k 次的下采样,可以获得一系列图像 I 1 = ( j / 2 , j / 2 ) , I 2 = ( j / 4 , j / 4 ) , . . . , I k = I_1=(j/2,j/2),I_2=(j/4,j/4),...,I_k= I1=(j/2,j/2),I2=(j/4,j/4),...,Ik= ( j / 2 k , j / 2 k ) : (j/2^k,j/2^k): (j/2k,j/2k):

其中, g ( I ) g(I) g(I)表示图像的高斯金字塔。在得到高斯金字塔之后,拉普拉斯金字塔可表示如下:

h k = L k ( I ) = G k ( I ) − u ( G k + 1 ( I ) ) = I k − u ( I k + 1 ) \boldsymbol{h}_k=\mathcal{L}_k(\boldsymbol{I})=\mathcal{G}_k(\boldsymbol{I})-u\big(\mathcal{G}_{k+1}(\boldsymbol{I})\big)=\boldsymbol{I}_k-u(\boldsymbol{I}_{k+1}) hk=Lk(I)=Gk(I)u(Gk+1(I))=Iku(Ik+1)
其中,拉普拉斯金字塔的第 k k k层等于高斯金字塔的第 k k k g k ( I ) g_k(I) gk(I)减去高斯金字塔第(k+1)层的上采样 u ( g k + 1 ( I ) ) u(g_{k+1}(I)) u(gk+1(I))

image-20240426162654321

输入噪声z 3 ′ _{3^{\prime}} 3 G 3 G_{3} G3生成 I ~ 3 \tilde{I}_{3} I~3,上采样得到 I 2 I_{2} I2,使用 I 2 I_{2} I2作为条件输入 G 2 , G_{2,} G2, 同时输入噪声z 2 _{2} 2生成差分图像 h ~ 2 \tilde{h}_{2} h~2, 添加到 I 2 I_{2} I2中生成 I ~ 2 \tilde{I}_{2} I~2

LAPGAN将条件对抗生成网络CGAN集成到拉普拉斯金字塔结构中:
I ~ k = u ( I ~ k + 1 ) + h ~ k = u ( I ~ k + 1 ) + G k ( z k , u ( I ~ k + 1 ) ) \tilde{\boldsymbol{I}}_k=u(\tilde{\boldsymbol{I}}_{k+1})+\tilde{\boldsymbol{h}}_k=u(\tilde{\boldsymbol{I}}_{k+1})+G_k(\mathbf{z}_k,u(\tilde{\boldsymbol{I}}_{k+1})) I~k=u(I~k+1)+h~k=u(I~k+1)+Gk(zk,u(I~k+1))
其中, G k G_k Gk表示第 k k k个卷积神经网络,也就是生成器,高斯金字塔第 k k k层的重建等于它的第 ( k + 1 ) (k+1) (k+1)层上采样 u ( I ~ k + 1 ) u(\tilde{I}_{k+1}) u(I~k+1)加上拉普拉斯金字塔的第 k k k h ~ k \widetilde{h}_k h k。除了最高层的生成器之外,其余生成器 G 0 G_0 G0 G 1 … G k − 1 G_1\ldots G_{k-1} G1Gk1都是采用上一级的上采样和噪声作为联合输入。上采样的结果就是LAPGAN中的条件变量。

Coarse-to-fine的视觉效果

image-20240426182823979

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/650680.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

redis常用数据结构

redis常用数据结构 Redis 底层在实现下面数据结构的时候,会进行特定的优化,来达到节省时间/空间的效果。 内部结构 String raw(最基本的字符串),int(实现计数功能,当value为整数的时候会用整…

webpackd打包两次-生成两份代码-出现legacy的js文件

当我们build后dist文件中出现legacy的js文件。 原因: pack.json文件; { *****"browserslist": ["> 0.03%","not dead"] }当我们项目运行在古老的浏览器上面时(表示支持市场份额超过 > 0.03% 的浏览器版…

力扣--N皇后

题目: 按照国际象棋的规则,皇后可以攻击与之处在同一行或同一列或同一斜线上的棋子。 n 皇后问题 研究的是如何将 n 个皇后放置在 nn 的棋盘上,并且使皇后彼此之间不能相互攻击。 给你一个整数 n ,返回所有不同的 n 皇后问题 的解决方案。…

【LLMOps】小白详细教程,在Dify中创建并使用自定义工具

文章目录 博客详细讲解视频点击查看高清脑图 1. 搭建天气查询http服务1.1. flask代码1.2. 接口优化方法 2. 生成openapi json schema2.1. 测试接口2.2. 生成openapi schema 3. 在dify中创建自定义工具3.1. 导入schema3.2. 设置工具认证信息3.3. 测试工具 4. 调用工具4.1. Agent…

C++实战演练---负载均衡在线oj项目预热

顾得泉:个人主页 个人专栏:《Linux操作系统》 《C从入门到精通》 《LeedCode刷题》 键盘敲烂,年薪百万! 前言 学习准备了快一年时间,心心念念的实战演练终于可以开始了,话不多说,直接进入主题…

使用streamlit构建网站

1.目的 最近团队有一个人脸识别的项目,想做一个网站界面来演示,同时使用了花生壳进行内网穿透,使得可以在其他设备访问该界面。 2.算法部分 import os os.environ[TF_CPP_MIN_LOG_LEVEL] 2 import matplotlib as mpl mpl.use(TkAgg) impo…

AI大模型探索之路-训练篇4:大语言模型训练数据集概览

文章目录 前言一、常用的预训练数据集1、网页2、书籍3、维基百科4、代码5、混合型数据集 二、常用微调数据集1、指令微调数据集1.1 自然语言处理任务数据集1.2 日常对话数据集1.3 合成数据集 2、人类对齐数据集 前言 在人工智能领域,构建强大的AI系统的关键步骤之一…

RTU遥测终端为城市排水安全保驾护航!

近年来,全球气候变迁与城市化进程不断加速,导致强降雨事件频发,道路低洼地带、下穿式立交桥和隧道等区域在暴雨中常易积水,严重阻碍了人民的出行,甚至危及生命与财产安全。而传统的排水管网管理方式已难以适应现代城市…

干货 :医疗企业渠道管理实战手册:策略、平台建设、CRM解决方案

最近与同行交流,对方调侃道:人形机器人和老头乐,应该也算医疗器械,是服务老人居家和出行的产品。确实,未来中国老龄化加重,医疗器械行业,也会注入新的增长动力。 长期以来,医疗器械…

用Vue做一个待办事项

这个待办事项有以下功能:增删查,既新增待办事项,删除待办事项,查看全部,未完成,完成待办事项,当鼠标移动到待办事项上时会显示删除按钮 分为四个部分来实现:ToDoHeader.vue、ToDoMai…

yudao-cloud微服务系统系统模块+后台管理系统成功运行

🌹作者主页:青花锁 🌹简介:Java领域优质创作者🏆、Java微服务架构公号作者😄 🌹简历模板、学习资料、面试题库、技术互助 🌹文末获取联系方式 📝 系列文章目录 第一章 芋…

Covalent Network(CQT)近三个月代币回购超 10 万美元

Covalent Network(CQT)报告了其代币回购计划的显著增长,自 2024 年 1 月底启动以来,已从公开市场回购了价值超过10万美元的 CQT 代币。该机制通过 Covalent Network(CQT)的 API 收入来回购 CQT 代币&#x…