对比学习简介

1. 引言

在本教程中,我们将介绍对比学习领域中的相关概念。首先,我们将讨论这种技术背后相关的理论知识;接着,我们将介绍最常见的对比学习的损失函数和常见的训练策略。

闲话少说,我们直接开始吧!

2. 举个栗子

首先,让我们通过简单的例子来增加对对比学习概念的理解 。我们不妨来玩一个许多孩子经常玩的游戏:
在这里插入图片描述

这个游戏的目标是从右侧的候选图片中,寻找看起来最像左侧动物的图像。在我们的例子中,孩子必须在右边的四张图片中搜索一张狗的照片。一般来说,孩子们必须将右侧图像一一和左侧图像进行比较,然后从中选择与之最相近的作为结果。

事实证明,对于没有任何先验知识的人来说,比如一个孩子,更容易通过对比相似和不同物体来学习新事物,而不是通过一个接一个地学习识别它们。也许最开始,孩子们可能无法识别狗。但过一段时间后,孩子就学会了如何区分狗的共同特征,比如鼻子的形状和身体姿势。

3. 方法论

受先前观察的启发,对比学习旨在通过对比相似和不同的样本来学习数据的低维度特征表示。具体来说,它试图使相似的样本在特征表示空间中彼此靠近,并使用欧几里得距离将不相似的样本推得很远。

假设我们有三个图像I1I2I3。前两张图片描绘了一只狗,第三张图片描绘了一只猫,我们想学习每张图片的特征低维表示(x1x2x3):
在这里插入图片描述

在对比学习中,我们希望最小化相似样本之间的距离,并最大化不同样本之间的距离。在我们的示例中,我们希望最小化相似样本距离 d(x1,x2)并最大化不相似样本距离 d(x1,x3)d(x2,x3),其中 d()是类似于欧几里得的度量函数。

与锚定样本 I1 相似的样本被定义为正样本 I2,不同的样本被定义为负样本 I3

4. 损失函数

对比学习最重要的部分是训练目标,它引导模型学习对比特征表示。对比损失是用于对比学习的首要训练目标函数之一。它采用一对相似或不相似的样本作为输入,并使相似的样本在特征空间内更接近,不相似的样本在特征空间中距离更远。

更一般的来说,假设我们有一对 输入 (Ii,Ij)和一个标签 Y,如果这一对样本相似,则标签Y等于 0,否则等于 1。为了提取每个样本的低维表示,我们使用卷积神经网络 f,将输入 Ii Ij映射到特征嵌入空间中,其中 xi = f(Ii) xj = f(Ij)。对比损失函数的定义为:
在这里插入图片描述

其中, m是一个超参数,用于定义不同样本之间的下限距离。

如果我们需要更具体地分析上述等式,则有两种不同的情况:
● 如果样本相似 (Y=0),则我们最小化项为 ||x_i - x_j||^2 对应于它们的欧几里得距离。
● 如果样本不同 (Y=1),则我们最小化项 max(0, m - ||x_i - x_j||^2) 这相当于最大化它们的欧几里得距离,直到某个极限 m

5. 无监督学习

当我们没有太多标注的样本时,这里可以使用自监督学习,利用数据的某些属性来生成伪标签。

一个著名的无监督对比学习的框架是 SimCLR 。它的主要思想是通过在锚图像中应用随机转换(如裁剪、翻转和颜色抖动)来生成正样本图像对,因为这些更改使图像的标签保持不变:
在这里插入图片描述

6. 结论

在本教程中,我们讨论了对比学习的相关概念和理论知识。首先,我们介绍了对比学习相关术语的概念,然后我们讨论了对比学习的目标损失函数和相应的自监督训练策略。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/312529.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MP4文件中mvhd容器中的“下一个track ID”字段的作用是什么?(下一个轨道id)(新轨道id)

文章目录 mvhd容器中有以下字段其中有个“下一个track ID”字段不知道是干什么用的,它被放在这个mvhd容器的最后“下一个track ID”什么是“下一个track ID”“下一个track ID”的作用唯一性标识轨道管理 “下一个track ID”的必要性命令/代码演示 新轨道ID的含义和…

HarmonyOS4.0系统性深入开发10卡片事件能力说明

卡片事件能力说明 ArkTS卡片中提供了postCardAction()接口用于卡片内部和提供方应用间的交互,当前支持router、message和call三种类型的事件,仅在卡片中可以调用。 接口定义:postCardAction(component: Object, action: Object): void 接口…

ES6之生成器(Generator)

✨ 专栏介绍 在现代Web开发中,JavaScript已经成为了不可或缺的一部分。它不仅可以为网页增加交互性和动态性,还可以在后端开发中使用Node.js构建高效的服务器端应用程序。作为一种灵活且易学的脚本语言,JavaScript具有广泛的应用场景&#x…

穷举vs暴搜vs深搜vs回溯vs剪枝

欢迎来到Cefler的博客😁 🕌博客主页:那个传说中的man的主页 🏠个人专栏:题目解析 🌎推荐文章:题目大解析(3) 目录 👉🏻全排列👉&#…

【ES】es介绍,使用spring-boot-starter-data-elasticsearch整合的ES来进行操作Es

文章目录 倒排索引(Inverted Index)和正排索引(Forward Index)es和MySQL对比IK分词器的总结mapping映射使用springboot整合的ES来进行操作Es1. 实体类中添加注解2. 编写Repository层3. 通过Repository进行增删改查 倒排索引&#…

java零拷贝zero copy MappedByteBuffer

目录 调用操作系统的 mmap 未使用 mmap 的文件通过网络传输的过程 使用 mmap 的文件通过网络传输的过程 使用例子 调用操作系统的 sendfile() 在 java 中的具体实现 mmap的优劣 mmap 的不足 mmap 的优点 mmap 的使用场景 对于零拷贝(zero copy&#xff09…

MCS接口技术----定时/计数,中断

目录 一.中断系统相关寄存器 1.51单片机中断系统的总体结构: 2.中断源的中断级别(由高到低): 3.与中断有关的四个寄存器: (1)TCON---定时控制寄存器 (2)IE---中断允…

2024-01-01 力扣高频SQL50题目 练习笔记

1. 1661求机器平均运行时间 在做这道题的时候,我遇到了4个问题 # 求平均的问题 如何找到个数? -> 相减对应列值后,直接average 就行。因为avg就是自动确定要除的个数(当然要联合正确的group by 分组) # 怎么根据machine_id和process_id…

Spring系列:Spring如何解决循环依赖

❤ 作者主页:欢迎来到我的技术博客😎 ❀ 个人介绍:大家好,本人热衷于Java后端开发,欢迎来交流学习哦!( ̄▽ ̄)~* 🍊 如果文章对您有帮助,记得关注、点赞、收藏、…

LeetCode刷题--- 不同路径 III

个人主页:元清加油_【C】,【C语言】,【数据结构与算法】-CSDN博客 个人专栏 力扣递归算法题 http://t.csdnimg.cn/yUl2I 【C】 ​​​​​​http://t.csdnimg.cn/6AbpV 数据结构与算法 ​​​http://t.csdnimg.cn/hKh2l 前言:这个专栏主要讲述递…

ACES 增强版不丹水稻作物地图(2016-2022 年)

ACES 增强版不丹水稻作物地图(2016-2022 年) 用于改善粮食安全决策的 2016-2022 年年度作物类型稻米地图仍然是不丹的一项挑战。这些地图是与不丹农业部和 SERVIR 合作开发的。通过专注于发展不丹的科学、技术、工程和数学 (STEM),我们共同开…

HTML进阶

列表、表格、表单 文章目录 列表、表格、表单01-列表无序列表有序列表定义列表 02-表格表格结构标签-了解合并单元格 03-表单input 标签input 标签占位文本单选框上传文件多选框下拉菜单文本域label 标签按钮 04-语义化无语义的布局标签有语义的布局标签 05-字符实体 01-列表 …