uCTRL论文阅读笔记

uCTRL: Unbiased Contrastive Representation Learning via Alignment and Uniformity for Collaborative Filtering论文阅读笔记

这篇文章应该是关于无偏推荐的

Abstract

​ 由于协作过滤(CF)模型的隐式用户反馈偏向于流行的项目,CF模型倾向于产生带有流行偏差的推荐列表。先前的研究使用了逆倾向加权(IPW)或因果推理来缓解这一问题。然而,他们只使用点态或成对损失函数,而忽略了采用对比损失函数来学习有意义的用户和项表示。在本文中,我们提出了无偏压缩表示学习(uCTRL),优化了CF模型的InfoNCE损失函数的对齐和一致性函数。具体来说,我们制定了一个在uCTRL中使用的无偏对齐函数。我们还设计了一种新的IPW估计方法,消除了用户和项目的偏差。

Introduction

​ 因为用户-项目交互通常偏向于流行的用户/项目,所以学习无偏见的用户/项目表示并非简单。用户-项目交互矩阵自然地遵循帕累托数据分布。虽然一些头部项目经常与用户互动,但许多尾部项目很少与用户互动。因此,CF模型很容易偏向于流行的用户/项目。因此,有偏差的用户/项目表示偏离了真正的用户偏好,导致较差的泛化性能。更糟糕的是,它们可以通过过度推荐流行商品而带来偏见放大。

​ 现存方法的一些局限性有:

  • (i)现有的关于在推荐系统中消除流行偏差的研究尚未积极地纳入对比损失函数,尽管它已被广泛地用于不同领域的更好的表示学习。
  • (ii)现有的去偏策略在估计倾向权重时没有考虑用户和项目,即使推荐模型从用户/项目交互中学习潜在的嵌入向量。

​ 本文提出了无偏压缩表示学习(uCTRL)。基于DirectAU ,对比表示学习被分解为两个损失函数:对齐和一致性。对齐函数表示正用户-项目交互的用户和项目向量之间的距离。一致性函数表示每个用户和项目分布的平均距离之和。虽然DirectAU 比现有的点级和成对损失函数显示出更好的性能,但可以观察到,对齐函数仍然偏向于用户/项目的流行程度

​ 为了解决这个问题,我们提出了一种无偏对齐函数,并设计了一种估算 IPW 的新方法,在对齐函数中去除了用户和项目流行度。

​ 本文的贡献有:

  • 我们引入了一种新的损失函数的无偏对比表示学习(uCTRL)通过对齐和一致性函数。
  • 我们还开发了一种新的倾向加权估计方法来消除用户/项目的偏差,并将其纳入无偏对齐函数中。

Background

​ 现有的研究将用户项目点击分解为两个组成部分:观察和相关性。如果用户知道该项目,并且她也对该项目感兴趣,那么用户就会点击一个项目。

\(P(y_{ui}=1)=P(o_{ui}=1)\cdot P(r_{ui}=1)=\omega_{ui}\cdot\rho_{ui}.\)

\(o_{ui}\)\(r_{ui}\)它们分别代表了观察的伯努利随机变量和相关性的伯努利随机变量。为简单起见,让𝜔𝑢𝑖和𝜌𝑢𝑖分别表示𝑃(𝑜𝑢𝑖= 1)和𝑃(𝑟𝑢𝑖= 1)。

无偏推荐学习

​ 无偏排名函数的目标是消除点击数据的偏差。有偏反馈的损失函数如下:

\(\mathcal{L}_{\mathrm{biased}}(\hat{\mathbf{R}})=\frac1{|\mathcal{D}|}\sum_{(u,i)\in\mathcal{D}}\left(y_{ui}\delta_{ui}^++(1-y_{ui})\delta_{ui}^-\right),\)

​ 𝛿+𝑢𝑖和𝛿−𝑢𝑖分别是相关对和无关对的损失函数值。

​ 我们通过用相关性变量𝜌𝑢𝑖替换点击变量𝑦𝑢𝑖来定义一个理想的损失函数。

\(\mathcal{L}_{\mathrm{ideal}}(\hat{\mathbf{R}})=\frac1{|\mathcal{D}|}\sum_{(u,i)\in\mathcal{D}}\left(\rho_{ui}\delta_{ui}^++(1-\rho_{ui})\delta_{ui}^-\right).\)

​ 缩小偏置损失函数和理想损失函数之间的差距是至关重要的。最近,Saito等人采用了逆倾向加权(IPW)来消除对点击数据的偏差。

\(\mathcal{L}_{unbiased}(\hat{\mathbf{R}})=\frac1{|\mathcal{D}|}\sum_{(u,i)\in\mathcal{D}}\left(\frac{y_{ui}}{\omega_{ui}}\delta_{ui}^++\left(1-\frac{y_{ui}}{\omega_{ui}}\right)\delta_{ui}^-\right),\)

​ 其中,𝜔𝑢𝑖是一个倾向得分,表示用户𝑢观察到项目𝑖的概率。关键问题是如何计算用户-项目交互对(𝑢,𝑖)的倾向得分。

对齐性和均匀性

​ 对齐是有偏的。如果我们将用户和项目向量之间的距离视为局部损失,这就相当于用有偏的点击数据作为标签来训练局部损失

\(\begin{aligned} \mathcal{L}_{\mathrm{align}}(\hat{\mathbf{R}})& =\underset{(u,i)\sim p_{\mathrm{pos}}}{\operatorname*{\mathbb{E}}}\|f(u)-f(i)\|^2 \\ &=\frac1{|\mathcal{D}_{click}|}\sum_{(u,i)\in\mathcal{D}_{click}}y_{ui}\|\tilde{f(u)}-\tilde{f(i)}\|^2, \end{aligned}\)

​ 其中,D𝑐𝑙𝑖𝑐𝑘是一组被单击的用户-项对。有必要通过消除点击偏差来优化对齐功能,使真正相关的用户-项目对在嵌入空间中更近。

Method

​ uCTRL的模型结构如下:

pkKEvGR.png

​ 在本节中,我们将介绍无偏压缩表示学习(uCTRL),它消除了点击数据的偏差。首先,我们推导出一个无偏点击数据的无偏对齐损失。然后,我们提出了一种新的估计倾向权重𝜔𝑢𝑖的无偏对齐函数的方法。最后,我们共同学习了无偏DirectAU和倾向权重估计模型。

无偏的DirectAU

​ DirectAU 通过对比学习训练用户和项目表示是有效的;然而,我们观察到,对齐损失偏向于点击数据,这与通过真实的用户偏好实现的理想损失函数不同。给定一组被点击的用户-项目对D𝑐𝑙𝑖𝑐𝑘,相关性的理想对齐损失表述如下。

\(\mathcal{L}_{\mathrm{ideal_align}}(\hat{\mathbf{R}})=\frac1{|\mathcal{D}_{click}|}\sum_{(u,i)\in\mathcal{D}_{click}}\rho_{ui}\|\tilde{f(u)}-\tilde{f(i)}\|^2.\)

​ 为了减少理想对齐损失函数和有偏对齐损失函数之间的差距,我们引入了现有研究中使用的IPW

\(\mathcal{L}_{\mathrm{unbiased_align}}(\hat{\mathbf{R}})=\frac{1}{|\mathcal{D}_{click}|}\sum_{(u,i)\in\mathcal{D}_{click}}\frac{y_{ui}}{\omega_{ui}}\|\tilde{f(u)}-\tilde{f(i)}\|^{2}.\)

​ 尽管它很简单,但它被期望收敛到真正的用户偏好的理想对齐损失。证明见原文

​ 与对齐损失不同,原始的均匀性损失利用采样的用户和项目对,而不考虑点击数据的偏差。它不需要用去偏置的方法来计算用户和项目的均匀性损失。最后,无偏DirectAU方法通过对正用户-项目对的无偏表示,使它们与真实偏好对齐,同时也促进了用户和项目的一致性

\(\mathcal{L}_{\mathrm{unbiased_DAU}}(\hat{\mathbf{R}})=\mathcal{L}_{\mathrm{unbiased_align}}(\hat{\mathbf{R}})+\gamma\mathcal{L}_{\mathrm{uniform}}(\hat{\mathbf{R}}).\)

计算倾向权重

​ 计算无偏对齐损失的关键问题是估计点击数据的倾向权重。虽然用户-项目交互的倾向权重严重影响了用户和项目的受欢迎程度,但现有的方法主要关注于估计项目的受欢迎程度。为了解决这一限制,我们采用了一种新的方法,它结合了用户和项目向量来预测倾向权重。

​ 具体来说,我们借用了TransR 的关键思想,它通过投影矩阵将实体空间上的不同实体投射到关系空间中。然后,它会计算出关系空间中的实体关系。虽然用户和项目向量是不同的信息,但它们是相关的。因此,我们首先将原始用户和项目向量转换为关系空间,以计算倾向权值。

\(f_r(u)=\tilde{f(u)}\mathbf{M}_u^\top,f_r(i)=\tilde{f(i)}\mathbf{M}_i^\top,\)

​ 其中,M𝑢∈R𝑑×𝑑和M𝑖∈R𝑑×𝑑是反映用户和项目不同特征的投影矩阵。𝑓𝑟(𝑢)和𝑓𝑟(𝑖)是用户𝑢和条目𝑖的投影向量。

​ 把\(\tilde{f(u)}\)\(\tilde{f(i)}\)进行替换为\(\tilde{f_r(u)}\mathrm{~and~}\tilde{f_r(i)}\)来将对齐性和均匀性进行优化

​ 因为用户和项目都在关系空间中表示出来了,所以我们通过取两个向量的点积来计算𝜔𝑢𝑖的倾向权重。

\(\hat{\omega}_{ui}=\sigma\left(f_{r}\tilde{(u)}\cdot\tilde{f_{r}(i)}^{\top}\right),\)

​ 其中,ˆ𝜔𝑢𝑖为估计的倾向权值,𝜎(·)为s型函数,𝑓𝑟˜(·)为l2归一化投影向量。最后,倾向得分被估计,以消除用户和项目的偏见。

​ 为了处理IPW的高方差问题,我们还采用了方差减少技术中常用的剪切方法。我们限制了ˆ𝜔𝑢𝑖的最小值。

\(\hat{\omega}_{ui}=\max\{\hat{\omega}_{ui},\mu\},\)

uCTRL损失函数

​ uCTRL的最终损失函数由两部分组成:学习真实偏好的无偏DirectAU损失和学习关系空间中用户和项目的投影向量的倾向权重估计损失。它联合学习了原始空间和关系空间的两个损失函数。

\(\mathcal{L}_{\mathrm{uCTRL}}(\hat{\mathbf{R}})=\mathcal{L}_{\mathrm{unbiased_DAU}}(\hat{\mathbf{R}})+\mathcal{L}_{\mathrm{relation_DAU}}(\hat{\mathbf{R}}).\)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/708945.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SQL Server 2012提供了多种备份和还原数据库的方法,包括以下几种:

SQL Server 2012提供了多种备份和还原数据库的方法,包括以下几种:SQL Server Management Studio(SSMS):SSMS是一个支持图形用户界面的工具,可以通过它备份和还原整个数据库或特定的数据表、视图等。在SSMS中,可以通过右键单击数据库并选择“任务” > “备份”或“还原…

BUUCTF-WEB(15-20)

[极客大挑战 2019]BabySQL 打开题目就试了试万能密码,是不行的推测应该做了过滤 我们密码框输入1 1 or 1=1试试发现我们的or没了,union,select,where都被过滤了,应该是被替换成空字符,所以我们可以双写绕过 uunionnion sselectelect wwherehere由于这里or被过滤了,我们无…

11个国内外免费域名解析服务

11个国内外免费域名解析服务 一般域名使用注册商提供的域名解析服务虽然方便,但功能大多有限,特别是目前国内还会针对某些DNS服务器进行屏蔽,造成网站无法解析的情况出现,因此,使用第三方域名解析服务也是中国网站的必要选择,这里就介绍一些常见的免费域名解析服务。 域名…

5/19/2024 测试

10pts 拿下 D1!挂分挂了 290pts! 痛失 rk3总结P 都不是,(本人)成绩构思依托(10pts)。 有重题,而且是同一场比赛出现两道 一模一样 的题(T1 && T4)题目 & 题解 T1 Color Description 有 \(n\) 个球排成一列,每个球都有一个颜色,用 \(A \sim Z\) 的大写字…

redis存储之序列化问题

1.问题描述:在SpringBoot集成Redis过程中,添加进redisf的内容如下2.出现这种情况的原因 (1) 键和值都是通过Spring提供的Serializer序列化到数据库的 (2) RedisTemplate默认使用的是JdkSerializationRedisSerializer,StringRedisTemplate默认使用的是StringRedisSerializer 3…

Vue3使用vue-cropper截图上传

!!!!!!!已使用另一个截图上传工具,稍后更新博客!!!!!! 使用vue-cropper进行截图上传 先安装 npm i vue-cropper编写组件 在components中添加imageCropper.vue 代码如下 <template><div><div><imgv-if="value"class="mb-2&qu…

渗透提权基础--linux权限

linux用户权限 在Linux系统中,根据权限的不同,大致可以将用户分为三种:超级用户、普通用户和虚拟用户。序号1为超级用户,分析出他为超级用户并不仅仅是因为他的用户名为root,还有他的UID(用户ID)和GID(组ID)为0,这是超级用户很重要的属性,且他的HOME目录为/root。 …

浅谈 FHQ Treap

浅谈 FHQ Treap 目录浅谈 FHQ Treap简单介绍前置操作结构分裂 split合并 merge一般操作Insertdelete查询排名为 \(x\) 的数查询 \(v\) 的排名 rank查询 \(x\) 的前驱 precursor查询 \(x\) 的后继 successor版题 简单介绍 FHQ Treap,以下简写为 \(fhq\),是一种treap(树堆)的变体…

INFINI Labs 产品更新 | Easysearch 1.8.0 发布数据写入限流功能

INFINI Labs 产品又更新啦~,包括 Easysearch v1.8.0、Gateway、Console、Agent、Loadgen v1.25.0。本次各产品更新了很多亮点功能,如 Easysearch 新增数据写入限流功能,可实现节点、分片级限流;Gateway 修复数据迁移过程中因消费不及时解压缩导致部分数据记录损坏而丢失记录…

OpenStack Centos7 T版本搭建

目录Centos7搭建OpenStack T版本 --上1. 环境准备(所有节点操作)1.1 修改主机名1.2 关闭selinux 以及防火墙1.3 修改hosts1.4 配置时间同步controller 操作compute以及其他节点操作1.5 配置OpenStack 软件包1.6 安装数据库1.7 安装消息队列1.8 安装memcached1.9 安装etcd2. 安装…