【域适应论文】MCC:Moment Matching for Multi-Source Domain Adaptation论文原理

文章目录

  • Moment Matching for Multi-Source Domain Adaptation论文原理
  • 主要贡献
  • 1 Introduction
  • 2 Related
  • 3 The DomainNet dataset
      • 1 背景
      • 2 DomainNet
      • 3 数据收集方法
      • 4 数据统计
      • 5 Quickdraw域数据收集方法
  • 4 Moment Matching for Multi-Source DA

Moment Matching for Multi-Source Domain Adaptation论文原理

  • ICCV 2019
  • 这篇论文介绍了一种解决多源域自适应问题的方法,称为Moment Matching for Multi-Source Domain Adaptation( M 3 S D A M^3SDA M3SDA
  • 传统的无监督域自适应UDA方法假设训练数据来自单一域,而实际情况往往是训练数据来自多个源头

主要贡献

  • 作者收集并标注了迄今为止最大的UDA数据集,称为DomainNet,包含了六个不同的域,大约有60万张图像,分布在345个类别
  • 论文提出了一种新的深度学习方法M3SDA,通过动态地对齐特征分布的矩来将多个标记源域中学到的知识转移到一个未标记的目标域
  • 论文提供了针对矩匹配方法的新的理论洞察,包括单一源域自适应和源域自适应

1 Introduction

2 Related

3 The DomainNet dataset

1 背景

  • 深度模型需要大量训练数据的事实,并且提到现有的视觉域自适应数据集要么规模较小,要么类别数量有限
  • 为了解决这一问题,作者收集了目前为止规模最大的域自适应数据集,即DomainNet

2 DomainNet

  • DomainNet包含六个不同的域,每个域都包含了345个常见物体的类别。这些域包括Clipart、Infograph、Painting、Quickdraw、Real和Sketch。
  • 每个域都有不同的特点
    • Clipart(剪贴画图像)
    • Infograph(信息图像)
    • Painting(艺术画作)
    • Quickdraw(“Quick Draw!”游戏中的玩家绘制的图像)
    • Real(真实照片和世界图像)
    • Sketch(特定物体的草图)

3 数据收集方法

  • Clipart、Infograph、Painting、Real和Sketch域的图像是通过在不同的图像搜索引擎中结合类别名称和域名称进行搜索来收集的
  • 为了清理数据集中的异常值,作者雇佣了20名注释员手动筛选异常值
  • 为了控制注释质量,每个图像分配了两名注释员,并且只有两名注释员都同意的图像才被接受
  • 筛选过程结束后,从网络爬取的120万张图像中保留了423.5k张图像

4 数据统计

数据集中各个域的平均每个类别的图像数量:

  • Clipart和Infograph约为150张
  • Painting和Sketch约为220张
  • Real约为510张

5 Quickdraw域数据收集方法

  • Quickdraw域的图像是直接从https://quickdraw.withgoogle.com/下载
  • 原始数据是一系列具有时间信息的离散点
  • 为了获得完整的绘图,作者使用了B-spline算法将每个击打中的所有点连接起来
  • 每个类别选择了500张图像,共形成Quickdraw域,总共包含了172.5k张图像

4 Moment Matching for Multi-Source DA

1 数据集

源领域的集合DS = {D1, D2, …, DN},其中每个源领域Di都是带标签的数据集。此外,还有一个未标记的目标领域DT

2 问题描述

  • 有多个带标签的源域数据
  • 一个未标记的目标域数据
  • 通过多个源领域的信息来适应目标领域的数据分布

3 Moment Distance

  • 衡量源领域集合DS和目标领域DT之间的差异
  • 通过对两个领域之间的特征分布的期望值进行比较来计算的

Moment Distance:源领域和目标领域之间的矩的平方差的总和
在这里插入图片描述

  • 第一项(关注单个领域):对于每个源领域和每个特征,计算其在源领域和目标领域上期望值的差异,并取平方。然后对所有源领域和特征进行求和,除以源领域的数量N,取平均值

  • 第二项(关注不同领域之间):

    • 1 N 2 \frac{1}{N^2} N21:表示对不同源领域组合的求和部分除以源领域的数量的平方,以取得平均
    • ∑ i = 1 N ∑ j = i + 1 N \sum_{i=1}^{N} \sum_{j=i+1}^{N} i=1Nj=i+1N:对不同的源领域组合进行求和
    • ∑ k = 1 X ( E ( X k i ) − E ( X k j ) ) 2 \sum_{k=1}^{X} (E(X_{ki}) - E(X_{kj}))^2 k=1X(E(Xki)E(Xkj))2:对于每个源领域组合和每个特征,计算其在不同源领域上期望值的差异,并取平方。然后对所有不同源领域组合和特征进行求和

4 M 3 S D A M^3SDA M3SDA

在这里插入图片描述

通过训练特征提取器G和分类器集合C,使得在源领域中的分类任务得到很好的执行,并且在共同的潜在特征空间中使源领域和目标领域之间的分布差异最小化。这个模型的设计旨在通过Moment Matching的方式实现多源领域自适应,以提高模型在目标领域上的性能,其中,包含以下组件:

  • 特征提取器G

  • Moment Matching组件

  • 分类器集合C:N个分类器,被表示为C = {C1, C2, …, CN},用于对源领域中的数据进行分类
    在这里插入图片描述

  • 目标函数=源域分类损失 + M D 2 MD^2 MD2

5 M 3 S D A − β M^3SDA-β M3SDAβ

M 3 S D A M^3SDA M3SDA的一个变种,同时对齐 p ( y ∣ x ) p(y|x) p(yx) p ( x ) p(x) p(x)

  • 训练特征提取器 G 和两个分类器(C 和 C’),分类多源领域的样本
  • 固定特征提取器 G ,对每个源领域的分类器对进行训练
  • 尽可能增大分类器C1 和 C1’在目标领域上的差异
  • 分类器输出的 L1 距离来度量两个分类器之间的差异
    在这里插入图片描述
  • 在固定分类器C 、C’,训练特征提取器 G 来最小化每一对分类器在目标领域上的差异
    在这里插入图片描述
  • 这三个训练步骤会周期性地进行,直到整个网络收敛
  • M 3 S D A − β M^3SDA-β M3SDAβ模型可以更好地对齐源领域和目标领域的特征分布以及类别条件概率分布

6 Ensemble Schema

在测试阶段,我们使用特征生成器和N个分类器对目标领域的测试数据进行处理,作者提出了两种组合分类器输出的方案。

  • 平均分类器输出:简单地对所有分类器的输出进行平均,标记为 M 3 S D A ∗ M^3SDA^* M3SDA
  • 加权平均分类器输出:每个分类器分配一个权重
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/529014.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

管理类联考-复试-管理类知识-其他常见词汇

文章目录 其他常见词汇营销4P、营销4C营销STP理论破窗效应价格歧视/区别定价定价策略——撇脂定价策略定价策略——渗透定价策略 心理账户机会成本看不见的手市场失灵马太效应鲶鱼效应禀赋效应(马克杯实验)羊群效应帕累托原则长尾理论 其他常见词汇 营销…

Python数值微积分,摆脱被高数支配的恐惧

文章目录 差分和累加积分多重积分 Python科学计算:数组💯数据生成 差分和累加 微积分是现代科学最基础的数学工具,但其应用对象往往是连续函数,而其在非连续函数的类比,便是差分与累加。在【numpy】中,可…

01-分析同步通讯/异步通讯的特点及其应用

同步通讯/异步通讯 微服务间通讯有同步和异步两种方式 同步通讯: 类似打电话场景需要实时响应(时效性强可以立即得到结果方便使用),而且通话期间不能响应其他的电话(不支持多线操作)异步通讯: 类似发邮件场景不需要马上回复并且可以多线操作(适合高并发场景)但是时效性弱响应…

电脑右下角出线白色弹窗的解决方法

电脑无缘无故,在右下角出现一个白色弹窗,无法关闭,非常恶心,后来经过查询,发现可能是360之类的弹bug,解决只需要: 1、鼠标左键 点击一下白框 2、键盘输入 AltF4 虽不是技术问题,但解…

day59 线程

创建线程的第二种方式 实现接口Runnable 重写run方法 创建线程的第三种方式 java.util.concurrent下的Callable重写call()方法 java.util.concurrent.FutureTask 创建线程类对象 获取返回值 线程的四种生命周期 线程的优先级1-10 default为5,优先级越高&#xff0c…

本地部署推理TextDiffuser-2:释放语言模型用于文本渲染的力量

系列文章目录 文章目录 系列文章目录一、模型下载和环境配置二、模型训练(一)训练布局规划器(二)训练扩散模型 三、模型推理(一)准备训练好的模型checkpoint(二)全参数推理&#xff…

数据结构(二)——顺序表和链表的比较

1、存取(读/写)方式 顺序表可以顺序存取,也可以随机存取,在第i个位置上执行存取操作,顺序表仅需一次访问. 链表只能从表头开始依次顺序存取,链表在第i个位置执行存取则需从表头开始依次访问i次. 2、逻辑结构与物理结…

【数据库系统概论】第2章:关系数据库

文章目录 0. 前言2.1 关系数据结构及形式化定义2.1.1关系2.1.2 关系模式 2.2 关系操作2.3 关系的完整性2.4 关系代数 0. 前言 关系数据库系统是支持关系模型的数据库系统。第一章初步介绍了关系模型及其基本术语。本章将深入介绍关系模型。 按照数据模型的三个要素,…

JS-06-数组

一、数组的创建与访问 见:JS-04-javaScript数据类型和变量 JavaScript的Array可以包含任意数据类型,并通过索引来访问每个元素。 要取得Array的长度,直接访问length属性: let arr [1, 2, 3.14, Hello, null, true]; console.l…

系统运维网络知识汇总

一、系统运维中网络方面的规划与思考 系统运维建立在网络的基础之上,如果没有一个相对合理的网络架构,恐怕系统运维做起来也不是那么的顺手。一个公司基本上都会把网络和服务器独立开来,划分不同的区域摆放设备,很多时候都是物理…

基于springboot+vue实现食品安全管理系统项目【项目源码+论文说明】计算机毕业设计

基于springboot实现食品安全管理系统演示 摘要 食品行业同其他行业有很多的差别,食品行业不仅要管食品的生产和销售,还要管食品的库存和保质期,那么对于食品管理者来说,就存在着一定的难度。况且食品的种类复杂,存储条…

JavaWeb实验 Servlet基础编程

实验目的 编写Servlet代码;熟悉并掌握Servlet的使用和配置。 实验内容 【1】利用Servlet实现一个简单的登录系统,要求: 包括登录页面、登录成功页面和登录失败提示页面;用户可以在登录页面输入用户名和密码;点击登…