对抗生成网络总结

news/2024/11/14 21:26:58/文章来源:https://blog.csdn.net/yaoyao_chen/article/details/132882540

对一些基本的对抗生成网络的总结。部分内容整理自Teeyohuang’s blog

文章目录

GAN (NeurIPS, 2014)
CGAN
DCGAN
StackGAN
Pix2Pix (CVPR, 2017)
CycleGAN (ICCV, 2017)
SRGAN (CVPR, 2017)
StyleGAN (CVPR, 2019)

GAN (NeurIPS, 2014)

Generative adversarial nets

$min_Gmax_DV(D,G) = E_{x\sim~P_{data}(x)}[logD(x)] + E_{z\sim~P_{z}(x)}[log(1-D(G(x)))]$ .

在实际训练的过程中，可以通过maximize logD(G(x))来训练G。

CGAN

Conditional generative adversarial nets

Pytorch版本代码

原始GAN的生成器G学到了数据的分布，生成出来的图片其实是随机的，也就是说这个G的生成过程处于一种没有指导的状态，虽然生成的图片，比如mnist数据集来说，生成的的确是数字，但是却没有具体的说是什么数字。 cGAN相当于在原始GAN的基础上加上一个条件：condition，以此来指导G的生成过程。
$min_Gmax_DV(D,G) = E_{x\sim~P_{data}(x)}[logD(x|y)] + E_{z\sim~P_{z}(z)}[log(1-D(G(z|y)))]$

y作为条件，和数据x以及噪声z同时分别进入D和G中。

DCGAN

unsupervised representation learning with deep convolutional generative adversarial networks

Pytorch版本代码

该网络主要使用卷积层，之前的网络用的是全连接层。

StackGAN

**StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks**

基于对CGAN的改进，CGAN无法生成清晰大图，StackGAN希望通过一个描述C，产生一张256x256的图像。通过两个generator实现，第一个generator产生64x64的小图，然后把结果放入第二个generator中生成256x256的大图。

详细内容

Pix2Pix (CVPR, 2017)

Image-to-image translation with conditional adversarial networks

本篇论文的核心思想并不复杂，是借鉴了conditional-GAN的思想。但pix2pix的generator的输入端只有条件y作为输入而没有噪声z。最终训练完成后可以从一张图A变换到另一张图B。

We demonstrate that this approach is effective at synthesizing photos from label maps, reconstructing objects from edge maps, and colorizing images, among other tasks.

在这里插入图片描述

CycleGAN (ICCV, 2017)

Unpaired image-to-image translation using cycle-consistent adversarial networks

CycleGAN详细解读

创新点：源于和目标域之间，无需建立训练数据一对一映射（对比pix2pix），就可实现风格迁移。

在CycleGAN中，不仅需要生成器产生的图片y’和数据集Y中的图片画风一样，还需要y’和输入图片x的内容一样。

Loss function: Loss GAN + Loss cycle
- Loss cycle: 将y‘放入生成器F中，产生的新图片x’与原始x尽可能相似。即F(G(x))=x。
- Loss GAN

SRGAN (CVPR, 2017)

**Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network**

首次使用生成对抗网络(GAN)应用于图像超分辨率(SR)

SRGAN论文阅读笔记

StyleGAN (CVPR, 2019)

A style-based generator architecture for generative adversarial networks

StyleGAN 用风格（style）来影响人脸的姿态、身份特征等，用噪声 ( noise ) 来影响头发丝、皱纹、肤色等细节部分。

StyleGAN论文超详细解读

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/108635.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Flutter的oktoast插件详解

Flutter的oktoast插件详解

文章目录简介详细介绍安装和导入导入在MaterialApp外面套一层OKToast组件为什么是包住MaterialApp？ 显示Toast消息： 高级使用Toast位置Toast持续时间自定义Toast样式高级用法使用场景提示消息表单验证操作反馈网络请求状态调试信息小结总结简介 okt…

阅读更多...

虚拟人三维动画宣传片案例分享 | 广州“五羊”城市文化IP商业体裸眼3D广告影片

虚拟人三维动画宣传片案例分享 | 广州“五羊”城市文化IP商业体裸眼3D广告影片

随着时代的发展元宇宙的助推，裸眼3D形式的宣传方式逐渐出现在大众眼前。以数字人IP的3D立体效果吸引大众目光，让其驻足拍照、录视频分享至社交平台，为企业品牌带来高频传播价值。近日，广州“五羊”城市文化IP裸眼3D广告宣传片在广…

阅读更多...

LeetCode算法心得——和可被 K 整除的子数组（前缀和+HashMap）

LeetCode算法心得——和可被 K 整除的子数组（前缀和+HashMap）

大家好，我是晴天学长，同余定理的应用，需要的小伙伴可以关注支持一下哦！后续会继续更新的。 1) .和可被 K 整除的子数组题目描述给定一个整数数组 A，返回其中元素之和可被 K 整除的（连续、非空&#xff0…

阅读更多...

使用k8s helm离线部署spark-operator（私有仓库）

使用k8s helm离线部署spark-operator（私有仓库）

制作镜像 docker pull ghcr.io/googlecloudplatform/spark-operator:v1beta2-1.3.8-3.1.1 docker images docker save ImageID > ./spark.tar将制作的镜像上传到目的机器中，加载镜像 docker load < ./spark.tar打标签其中xxxx.xxx/xx/为私有仓库的地址 doc…

阅读更多...

尚硅谷大数据项目《在线教育之实时数仓》笔记001

尚硅谷大数据项目《在线教育之实时数仓》笔记001

视频地址：尚硅谷大数据项目《在线教育之实时数仓》_哔哩哔哩_bilibili 目录 P001 P002 P003 P004 P005 P001 以在线教育采集系统和离线数仓为前置基础，分为三个部分讲解：实时数仓架构介绍、数仓模型搭建、Suger可视化大屏展示。 P002 P0…

阅读更多...

【动态规划刷题 14】最长递增子序列摆动序列

【动态规划刷题 14】最长递增子序列摆动序列

673. 最长递增子序列的个数链接: 673. 最长递增子序列的个数给定一个未排序的整数数组 nums ， 返回最长递增子序列的个数。注意这个数列必须是严格递增的。示例 1: 输入: [1,3,5,4,7] 输出: 2 解释: 有两个最长递增子序列，分别是 [1, 3, 4,…

阅读更多...

jd(商品详情）API接口

jd(商品详情）API接口

为了进行电商平台的API开发，首先我们需要做下面几件事情。 1）开发者注册一个账号 2）然后为每个jd应用注册一个应用程序键（App Key) 。 3）下载jdAPI的SDK并掌握基本的API基础知识和调用 4）利用SDK接口和…

阅读更多...

GIS前端-地图事件编程

GIS前端-地图事件编程

GIS前端-地图事件编程图层操作事件地图状态事件交互事件弹出框事件导出PDF 在地图上的一切操作均要采用地图事件机制来实现，即通过鼠标、键盘等交互，触发地图相关事件，进而调用相关功能接口函数实现相应的GIS功能。在具体的实现过程中&#…

阅读更多...

openpnp - 设备电源抗干扰部件的选择

openpnp - 设备电源抗干扰部件的选择

文章目录 openpnp - 设备电源抗干扰部件的选择概述END openpnp - 设备电源抗干扰部件的选择概述设备电源部分的干扰主要来自伺服和真空泵. 伺服是设备开机期间, 一直供电, 采用滤波器比较好. 型号为 CW4L2-10A-S(004)或者CW4-10A-S(004) CW4L2-10A-S(004)是二级滤波. CW4-1…

阅读更多...

07 目标检测-YOLO的基本原理详解

07 目标检测-YOLO的基本原理详解

一、YOLO的背景及分类模型 1、YOLO的背景上图中是手机中的一个app，在任何场景下(工业场景，生活场景等等)都可以试试这个app和这个算法，这个app中间还有一个button，来调节app使用的模型的大小，更大的模型实时性差但精…

阅读更多...

从零基础到精通Flutter开发：一步步打造跨平台应用

从零基础到精通Flutter开发：一步步打造跨平台应用

💂 个人网站:【工具大全】【游戏大全】【神级源码资源网】🤟 前端学习课程：👉【28个案例趣学前端】【400个JS面试题】💅 寻找学习交流、摸鱼划水的小伙伴，请点击【摸鱼学习交流群】导言 Flutter是一种流行…

阅读更多...

【HTML专栏2】VSCode的使用（新建HTML文件）

【HTML专栏2】VSCode的使用（新建HTML文件）

本文属于HTML/CSS专栏文章，适合WEB前端开发入门学习，详细介绍HTML/CSS如果使用，如果对你有所帮助请一键三连支持，对博主系列文章感兴趣点击下方专栏了解详细。博客主页：Duck Bro 博客主页系列专栏：HTML/CS…

阅读更多...

推荐文章

最新文章