机器学习:领域自适应学习

训练一个分类器是小问题

在这里插入图片描述

上难度

在这里插入图片描述
训练数据和测试数据不一致,比如训练数据是黑白的,测试时彩色的,结果准确率非常低。
训练数据和测试数据有点差距的时候,能不能效果也能好呢?这就用到了领域自使用domain adptation
在这里插入图片描述
用一个领域学到的知识,用到另外一个领域。

Domain Shift

在这里插入图片描述
有多种多样的domain shift

  • 分布频次不一样
  • 标签不一致

这里只考虑分布不一样
在这里插入图片描述
在这里插入图片描述

  • 有标注的数据量,但比较少,可以通过微调的方式进行训练,跑2-3个epoch
  • 小心不要过拟合

在这里插入图片描述
现在问题是有大量的图像,但是没有标注,怎么用这些没有标注的数据用来训练模型。
在这里插入图片描述
把颜色去掉,这样就能一样训练了。

Domain Adversarial Training

在这里插入图片描述
把前5层当作feature extractor,后5层当作label predictor。
想要有标注的数据和无标注的数据抽取后的特征在分布上没有什么差别。
在这里插入图片描述

  • 特征抽取器:学会愚弄领域分类器
  • 不能让特征抽取器永远输出0,也需要label predictor的训练
    在这里插入图片描述

Limitation

在这里插入图片描述

  • 三角形和矩形越相近越好,但如何衡量呢?

在这里插入图片描述
考虑边界
在这里插入图片描述

  • 考虑外包围
    在这里插入图片描述

在这里插入图片描述
更坏的情况:

  • 只有一张
  • 甚至都不知道

一张都不知道的话就不叫domain adaptation而是domain generalization
在这里插入图片描述
data aug 进行数据增强
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/230889.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一款LED段码显示屏驱动芯片方案

一、基本概述 TM1620是一种LED(发光二极管显示器)驱动控制专用IC,内部集成有MCU数字接口、数据锁存器、LED驱动等电路。本产品质量可靠、稳定性好、抗干扰能力强。 二、基本特性 采用CMOS工艺 显示模式(8段6位~10段4位&#xff…

【人工智能Ⅰ】实验2:遗传算法

实验2 遗传算法实验 一、实验目的 熟悉和掌握遗传算法的原理、流程和编码策略,理解求解TSP问题的流程并测试主要参数对结果的影响,掌握遗传算法的基本实现方法。 二、实验原理 旅行商问题,即TSP问题(Traveling Salesman Proble…

Spark on yarn 模式的安装与部署

任务描述 本关任务: Spark on YARN 模式的安装与部署。 相关知识 为了完成本关任务,你需要掌握: Spark 部署模式的种类;Spark on YARN 模式的安装。 Spark 部署模式 Spark 部署模式主要分为以下几种,Spark Stand…

Linux高级IO

文章目录 一.IO的基本概念二.钓鱼五人组三.五种IO模型四.高级IO重要概念1.同步通信 VS 异步通信2.阻塞 VS 非阻塞 五.其他高级IO六.阻塞IO七.非阻塞IO 一.IO的基本概念 什么是IO? I/O(input/output)也就是输入和输出,在著名的冯诺…

MySQL 中的锁(三)

8.7. 死锁和空间锁 一般来说,只要有并发和加锁这两种情况的共同加持下,都会有死锁的身影。 死锁的具体成因,借用我们在并发编程中的内容: 8.7.1. 死锁 8.7.1.1. 概念 是指两个或两个以上的进程在执行过程中,由于竞…

LeetCode(42)有效的字母异位词【哈希表】【简单】

目录 1.题目2.答案3.提交结果截图 链接: 有效的字母异位词 1.题目 给定两个字符串 *s* 和 *t* ,编写一个函数来判断 *t* 是否是 *s* 的字母异位词。 **注意:**若 *s* 和 *t* 中每个字符出现的次数都相同,则称 *s* 和 *t* 互为字…

Matlab下载许可证文件 教程(在账号有许可证的前提下)

文章目录 Part.I IntroductionPart.II 许可证文件过期解决方案Chap.I 使用 Internet 自动激活Chap.II 在不使用 Internet 的情况下手动激活 Part.I Introduction 本文主要介绍,在 Mathwork 账号有许可证的前提下,下载许可证的操作流程。 好久没有用 Mat…

Linux小程序之进度条

> 作者简介:დ旧言~,目前大二,现在学习Java,c,c,Python等 > 座右铭:松树千年终是朽,槿花一日自为荣。 > 目标:自己能实现进度条 > 毒鸡汤: > …

【hacker送书第5期】SQL Server从入门到精通(第5版)

第5期图书推荐 内容简介作者简介图书目录参与方式 内容简介 SQL Server从入门到精通(第5版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了SQL Server开发所必需的各方面技术。全书分为4篇共19章,…

觉得可视化地图太难做?那你是没用过它!

后台一直有粉丝私信老李,问到现在各大企业对数据可视化越来越看重,但是感觉那些高大上的图表做起来一定很复杂甚至可能还需要一些编程基础,希望老李可以推荐一些简单好上手的数据可视化工具。   作为一名数据分析爱好者,我也尝试…

DDoS高防IP到底是什么?

DDoS高防IP是提供一个带防御的IP,主要是针对网络中的DDoS攻击进行保护,是针对互联网服务器遭受大流量的DDoS攻击后,导致服务不可用的情况下,用户可以通过配置高防IP,将攻击流量引流到高防IP上,从而确保源站…

python基础练习题库实验7

文章目录 题目1代码实验结果题目2代码实验结果题目3代码实验结果题目总结题目1 编写代码创建一个名为Staff的类和方法__init__,以按顺序初始化以下实例属性: -staff_number -first_name -last_name -email 代码 class Staff:def __init__(self, staff_number, first_name,…