CycleGAN 是如何工作的?

一、说明

        CycleGAN即循环对抗网络,是图像翻译成图像的模型;是Pix2Pix模型的扩展,区别在于,Pix2Pix模型需要输入图像和目标图像成对给出训练,CycleGAN则不需要,例如:从 SAR 生成 RGB 图像、从 RGB 生成多光谱图像、从卫星图像生成地图路线等,并且在训练中需要反向逆训练,因此称为循环Gan。

二、介绍

        CycleGAN 是图像到图像的翻译模型,就像Pix2Pix一样。Pix2Pix模型面临的主要挑战是训练所需的数据应该配对,即源域和目标域的图像应该位于相同的位置,并且两个域的图像数量也应该相同。

        循环生成对抗网络(CycleGAN)是一种训练深度卷积神经网络以执行图像到图像翻译任务的方法。网络使用不成对的数据集学习输入和输出图像之间的映射。例如:从 SAR 生成 RGB 图像、从 RGB 生成多光谱图像、从卫星图像生成地图路线等。

        该模型是 Pix2Pix 架构的扩展,涉及两个生成器模型和两个判别器模型的同时训练。除了 Pix2Pix 的功能之外,我们还可以使用不配对的数据集,并且还可以使用相同的模型反向转换图像(目标到源图像)。

三、模型架构

图 1. CycleGAN 架构概述:从卫星图像转换到地图路线域 [3]

要了解 GAN 的基础知识,可以参考Pix2Pix 指南。

该模型架构由两个生成器模型组成:一个生成器(Generator-A)用于生成第一个域(Domain-A)的图像,第二个生成器(Generator-B)用于生成第二个域(Domain-B)的图像。

  • 域-B ->生成器-A -> 域-A
  • 域-A ->生成器-B -> 域-B

每个生成器都有一个相应的判别器模型(判别器-A 和判别器-B)。鉴别器模型从域中获取真实图像并从生成器中获取生成的图像来预测它们是真还是假。

  • 域-A ->鉴别器-A -> [真/假]
  • 域-B -> 生成器-A ->判别器-A -> [真/假]
  • 域-B ->鉴别器-B -> [真/假]
  • 域-A -> 生成器-B ->判别器-B -> [真/假]

在 中arcgis.learn,所有判别器和生成器都被分组为一个模型。

四、训练时loss是如何计算的?

        用于训练生成器的损失由三部分组成:

  1.         对抗性损失:我们将对抗性损失应用于两个生成器,其中生成器尝试生成其域的图像,而其相应的判别器区分翻译样本和真实样本。生成器的目标是最小化这种损失,而相应的判别器则试图最大化这种损失。
    1.         循环一致性损失:它捕捉到了这样的直觉:如果我们将图像从一个域转换到另一个域并再次转换回来,我们应该到达我们开始的地方。因此,它计算原始图像和最终生成图像之间的 L1 损失,该图像应该看起来与原始图像相同。从两个方向进行计算:
  • 正向循环一致性:域-B ->生成器-A -> 域-A ->生成器-B -> 域-B
  • 后向循环一致性:Domain-A -> Generator-B -> Domain-B -> Generator-A -> Domain-A
  1.         身份丢失:它鼓励生成器保留输入和输出之间的颜色成分。这是通过向生成器提供目标域的图像作为输入并计算输入和生成图像之间的 L1 损失来完成的。
*   Domain-A -> **Generator-A** -> Domain-A
*   Domain-B -> **Generator-B** -> Domain-B

        由于所有这些损失函数在获得高质量结果方面都发挥着关键作用。因此,这两个生成器模型都是通过所有这些损失函数的组合来优化的。

五、实施于arcgis.learn

        首先,我们必须使用arcgis pro中的格式导出图像芯片,然后使用中的函数Export Tiles创建一个databunchprepare_dataarcgis.learn

data = arcgis.learn.prepare_data(path=r"path/to/exported/data", dataset_type='CycleGAN')

        要传递的重要参数是:

  • path数据目录。我们需要遵循图2所示的目录结构。这里,“train_a”和“train_b”文件夹包含域A和B的图像。

图 2. 目录结构

  • dataset_type“CycleGAN”。

        创建数据束后,我们可以通过调用初始化 CycleGAN 对象

cyclegan_model = arcgis.learn.CycleGAN(data)

        与其他一些模型不同,我们从头开始训练 CycleGAN,某些初始时期的学习率为 0.0002,然后在下一个时期将学习率线性衰减到零。

        然后我们可以继续基本的 arcgis.learn 工作流程。有关 API 和模型的更多信息,请访问API 参考。

参考

[1] Jun-Yan Zhu,Taesung Park,Phillip Isola,Alexei A. Efros,“使用循环一致对抗网络的不配对图像到图像翻译”,2017;arXiv:1703.10593。

[2] Jason Brownlee:Cyclegan 教程。访问日期:2020 年 9 月 29 日。

[3]。康宇豪、高松和罗伯特·E·罗斯。“使用生成对抗网络传输多尺度地图样式。” 国际制图杂志 5,no。2-3(2019):115-141。

How CycleGAN Works? | ArcGIS API for Python

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/312811.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在STM32上使用DMA进行UART通信

本文将介绍如何在STM32上使用DMA(Direct Memory Access)进行UART通信,以提高数据传输效率。我们将介绍STM32的DMA和UART模块的基本概念和使用方法,并给出相关的示例代码和注意事项。DMA(Direct Memory Access&#xff…

Spark中的数据加载与保存

Apache Spark是一个强大的分布式计算框架,用于处理大规模数据。在Spark中,数据加载与保存是数据处理流程的关键步骤之一。本文将深入探讨Spark中数据加载与保存的基本概念和常见操作,包括加载不同数据源、保存数据到不同格式以及性能优化等方…

Python pycharm编辑器修改代码字体

在pycharm编辑器下修改代码字体,可以按照以下步骤: 点开上图所示的菜单, 再点击File->Settings,进入设置页面。 我们找到Editor下的Font并点选,然后我们就可以在右侧修改字体相关配置了。 这里建议使用等宽字体&…

C++面试宝典第13题:计算餐厅账单

题目 假如你是一家餐厅的收银员,需要编写一个程序来计算顾客的账单。程序应该能够接受顾客点的菜品和数量,并根据菜品的单价计算出总价。另外,程序还应该能够处理折扣和优惠券,并输出最终的账单金额。 解析 这道题主要考察应聘者使用面向对象的设计方法来解决实际问题的能力…

2023年“中银杯”四川省职业院校技能大赛“云计算应用”赛项样题卷②

2023年“中银杯”四川省职业院校技能大赛“云计算应用”赛项(高职组) 样题(第2套) 目录 2023年“中银杯”四川省职业院校技能大赛“云计算应用”赛项(高职组) 样题(第2套) 模块…

【数据结构】栈和队列(队列的基本操作和基础知识)

🌈个人主页:秦jh__https://blog.csdn.net/qinjh_?spm1010.2135.3001.5343🔥 系列专栏:《数据结构》https://blog.csdn.net/qinjh_/category_12536791.html?spm1001.2014.3001.5482 ​ 目录 前言 队列 队列的概念和结构 队列的…

分布式IO在工业自动化中的应用

传统的自动化产线及物流系统主要是利用PLC来处理数据,并将这些数据保存在PC当中。但是随着互联网技术的迅速发展,越来越多的系统集成商利用分布式IO模块,实现从控制器到自动化最底层之间的IO通信。 分布式IO在工业自动化中的应用 分布式IO是用…

详解Vue3中的鼠标事件mousemove、mouseover和mouseout

本文主要介绍Vue3中的常见鼠标事件mousemove、mouseover和mouseout。 目录 一、mousemove——鼠标移动事件二、mouseover——鼠标移入事件三、mouseout——鼠标移出事件 下面是Vue 3中常用的鼠标事件mousemove、mouseover和mouseout的详解。 一、mousemove——鼠标移动事件 鼠…

Motionface VoiceFocus使用教程

Motionface VoiceFocus使用教程 1:系统要求 软件运行支持32位/64位window 10/11系统, 其他要求无。 2:下载安装 链接:百度网盘 请输入提取码 提取码:1234 复制这段内容后打开百度网盘手机App,操作更方便哦 下载VoiceFo…

python使用openpyxl为excel模版填充数据,生成多个Sheet页面

目标:希望根据一个给定的excel模版,生成多个Sheet页面,比如模版: 示例程序 import openpyxlexcel_workbook openpyxl.load_workbook("模版.xlsx") for _i in range(3): # 比如填充3个页面# 复制模版sheet页&#x…

解决Android Studio的adb命令行报错Permission denied问题-建议收藏备用!

目录 前言 一、报错信息 二、常见解决方法 三、最简单的解决方法 四、更多资源 前言 随着移动设备的普及,Android操作系统成为了全球最主要的移动设备操作系统之一。在开发和调试Android应用程序时,我们常常需要使用adb(Android Debug B…

js中的数组使用及常见属性方法

数组概念 数组对象的作用是:使用单独的变量名来存储一系列的值。 数组创建方法 构造函数的方法       var arr new Array()       var arr new Array(5)       var arr new Array("嘻嘻")     字面量的方法       var arr…