GAN:DCGAN-深度卷积生成对抗网络

论文:https://arxiv.org/pdf/1511.06434.pdf

发表:ICLR 2016

一、架构创新

1:全卷积网络:用逐步卷积代替确定性的空间池化函数(如maxpooling),使网络学习自己的空间下采样。使用这种方法,允许它学习他自己的空间上采样和鉴别器。

2:取消卷积特征之上的全连接层:gap平均池化层提升了模型的稳定性,但降低了收敛速度。

3:批量标准化BN有助于处理由于初始化较差而出现的训练问题,并帮助深层模型中的梯度流。这证明深层生成器开始学习非常重要。直接将批处理应用于所有层面,会导致样品振荡和模型不稳定。通过不将批处理应用于生成器输出层和鉴别器输入层来避免

生成器中除了output层使用Tanh 激活,其他层使用ReLU激活。判别器中使用leaky ReLU激活。 

 

二、训练干货

1:除了缩放至tanh激活函数[-1,1]的范围之外,没有对训练图像进行应用预处理。

2:使用小批量随机梯度下降法(SGD)进行训练,batch size为128。

3:权重初始化都是以零为中心的正态分布初始化的,标准偏差为0.02。

4:在LeakyReLU中,斜率设置为0.2。

5:使用Adam优化器。我们发现建议的学习率为0.001太高,用0.0002来代替。此外,我们发现将动量项留在0.9的建议值导致了训练振荡和不稳定性,同时将其降低到0.5,这有助于稳定训练。

三、操纵生成表示

  • 去除图像中某些物体,论文中实现的方法如下:
    • 选择152张生成的图片,对其中52张有窗户的图像,标记窗户的location。
    • 在倒数第二层卷积features上,使用逻辑回归找出窗户的位置。来自窗户的位置区域的是positives,图上的其他区域是negatives。
    • 将窗户区域中weights大于0的特征进行丢弃(手动设置为0)。
    • 使用相同的输入特征,重新生成图片。
    • 论文配图如下:
      • 第一行为原始图片(有窗户)。
      • 第二行为将窗户相关特征添加到dropout后的结果(没有窗户)。
      • 总体结果:图像变模糊,但窗户在一定程度上也少了。

四、人脸上的尝试

经典示例:king国王特征 - man男性特征 + women女性特征 = queen女王特征

对单个样本进行实验,结果是不稳定的,但是对三个样本的Z向量进行平均,显示了在语义上服从算术是一致的和稳定的。此外,我们还证明了人脸姿态也是在Z空间中线性建模的。 (暗指人脸编辑是可行的,当然这个是16年,很早的文章了,很有启发性。后续已经有更好的方案了)

3个女性(微笑表情)的平均 - 3个女性(正常表情)的平均  + 3个男性(正常表情)的平均

 = 可以生成微笑表情的男性

左边3列:

对于每一列,将样本的Z向量进行算术运算,得到新的向量Y。

右边3列:

中间样本是通过将 Y 作为输入提供给生成器而生成的。

其他两列是通过使用比例为 +-0.25 的均匀噪声采样对Y进行操作,产生得到。

 、代码尝试

1:阅读pytorch官方指南:https://pytorch.org/tutorials/beginner/dcgan_faces_tutorial.html

2:使用pytorch官方代码:https://github.com/pytorch/tutorials/blob/main/beginner_source/dcgan_faces_tutorial.py

迭代了50个epoch的效果,还是比较抽象吧,但可以很好学习code。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/229276.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android Studio 添加so无法打包进apk问题

1.开发环境: Android Studio 2022.3.1 Patch 2 jdk 17 gradle-7.4 2.build.grade配置检查 首先查看build.gradle中是否设置sourceSets ,如果设置的话,打包的时候so是被指导libs目录下的,所有就不能把jnilibs下。 sourceSets {mai…

如何使用APP UI自动化测试提高测试效率与质量?

pythonappium自动化测试系列就要告一段落了,本篇博客咱们做个小结。 首先想要说明一下,APP自动化测试可能很多公司不用,但也是大部分自动化测试工程师、高级测试工程师岗位招聘信息上要求的,所以为了更好的待遇,我们还…

如何与LEONI建立EDI连接?

莱尼LEONI是一家为汽车及其他行业提供能源数据管理产品、解决方案及服务的全球供应商。供应链范围从研发生产标准化电缆、特种电缆和数据电缆到高度复杂的布线系统和相关组件。本文将介绍如何与莱尼LEONI建立EDI连接。 什么是EDI? EDI全称Electronic Data Interch…

P8A004-系统加固-磁盘访问权限

【预备知识】 访问权限,根据在各种预定义的组中用户的身份标识及其成员身份来限制访问某些信息项或某些控制的机制。访问控制通常由系统管理员用来控制用户访问网络资源(如服务器、目录和文件)的访问,并且通常通过向用户和组授予…

运算符重载

运算符重载 类对象不能直接参与运算,需要对运算符进行重载。 运算符预定义的操作只能针对基本数据类型,但是对于自定义类型,若需要类似的运算符操作,此时也可以重新定义这些运算符的功能,使其支持特定类型&#xff0c…

数学建模-基于LightGBM和BP神经网络的互联网招聘需求分析与预测

基于LightGBM和BP神经网络的互联网招聘需求分析与预测 整体求解过程概述(摘要) 就业是民生之本,是发展之基,也是安国之策。2020 年新冠肺炎疫情的爆发,稳就业成为应对疫情、稳定社会的重要保障之一。随着数据新动能的发展,互联网…

这个变量要不要用volatile修饰呢?

正文 大家好,又见面了,我是bug菌~ 在嵌入式软件开发过程中,如果对volatile不熟,那可以你应该是个"假嵌入式程序员",因为一个变量需不需要使用volatile考虑的场景挺多的,如果在某些场景下乱用&…

(附源码)基于NET学生信息管理系统-计算机毕设 24077

基于NET学生信息管理系统 摘 要 随着互联网趋势的到来,各行各业都在考虑利用互联网将自己推广出去,最好方式就是建立自己的互联网系统,并对其进行维护和管理。在现实运用中,应用软件的工作规则和开发步骤,采用C#技术建…

【vue ui 一直卡在 Starting GUI..】

vue ui 解决问题 1.如果项目一直卡在 Starting GUI..2.解决方法 (切换数据源)3.成功解决 1.如果项目一直卡在 Starting GUI… 2.解决方法 (切换数据源) 直接在cmd中输入如下 npm config set registry http://registry.npm.taobao.org/3.成功解决

璞华大数据产品入选中国信通院“铸基计划”

武汉璞华大数据技术有限公司HawkEye设备数字化管理平台产品,凭借优秀的产品技术能力,通过评估后,入选中国信通院“铸基计划”《高质量数字化转型产品及服务全景图(2023)》的工业数字化领域。 “铸基计划”是中国信通院…

MS1242/MS1243:24bit 高精度、低功耗模数转换器

产品简述 MS1242/MS1243 是一款高精度、宽动态范围、 ∆-Σ 模数转 换芯片,其工作电压为 2.7V 至 5.25V ,可以达到 24bit 无失码转 换,有效精度可达 21bit 。 MS1242/MS1243 可以广泛使用在工 业控制、称重、液体 / 气体化学分析、血液分…

IMO国际奥林匹克数学竞赛推出AI-MO,奖金高达1000万美元; SDXL Turbo: 新一代文本到图像模型

🦉 AI新闻 🚀 IMO国际奥林匹克数学竞赛推出AI-MO,奖金高达1000万美元 摘要:IMO国际奥林匹克数学竞赛推出新的AI竞赛AI-MO,旨在推动大语言模型的数学推理能力,鼓励开发能与人类数学天才相媲美的AI模型。比…