京东搜索重排:基于互信息的用户偏好导向模型

news/2024/11/14 12:55:19/文章来源:https://www.cnblogs.com/Jcloud/p/18381169

 

 

SIGIR 24: A Preference-oriented Diversity Model Based on Mutual-information in Re-ranking for E-commerce Search

链接:https://dl.acm.org/doi/abs/10.1145/3626772.3661359

摘要:重排是一种通过考虑商品之间的相互关系来重新排列商品顺序以更有效地满足用户需求的过程。现有的方法主要提高商品打分精度,通常以牺牲多样性为代价,导致结果可能无法满足用户的多样化需求。相反,旨在促进多样性的方法可能会降低结果的精度,无法满足用户对准确性的要求。为了解决上述问题,本文提出了一种基于互信息的偏好导向多样性模型(PODM-MI),在重排过程中同时考虑准确性和多样性。具体而言,PODM-MI采用基于变分推理的多维高斯分布来捕捉具有不确定性的用户多样性偏好。然后,我们利用最大变分推理下界来最大化用户多样性偏好与候选商品之间的互信息,以增强它们的相关性。随后,我们基于相关性得出一个效用矩阵,使项目能够根据用户偏好进行自适应排序,从而在上述目标之间建立平衡。在京东主搜上的实验结果证明了PODM-MI的显著提升。

1、背景及现状

•用户从搜索到下单过程中存在不同的决策阶段(买、逛等),用户不同的决策阶段对多样性也有不同需求,现阶段模型没有直接建模不同决策阶段和多样性的关系。

•用户需求考虑。

 

 

◦重排阶段需要充分考虑用户需求。通常来说,用户的需求是个性化的,即部分场景下对于排序结果的准确性要求较高,而另一部分场景下对于排序结果的多样性要求较多。在这种情况下,一个合适的重排排序算法应该自适应地根据用户需求进行结果调整,即当用户需要多样性时,搜索排序结果应当包含尽可能不同的商品来满足用户的多种兴趣来满足用户的多样性需求;而当用户需要准确性时,排序结果应包含最符合用户或用户最感兴趣的单一类别商品。例如,用户从搜索“连衣裙”到逐渐缩小范围到“荷叶边连衣裙”,这一过程中,他们的搜索意图从多样化逐渐变得明确和具体。要在重排阶段平衡效率指标和多样性,我们面临两个主要挑战:

1.准确建模用户的决策意图困难,因为其意图会在多次搜索中逐渐演变。

2.即使成功建模了用户的意图,如何加强搜索结果与用户演变意图的匹配关系?

为了解决这些挑战,我们提出了PODM-MI(基于互信息的偏好导向多样性模型)。

2、PODM-MI

 

 

PODM-MI模型以排序列表和用户行为数据(如点击流和加入购物车的行为)为输入。首先,我们使用PON捕捉用户的多样性偏好和候选商品的多样性表示。然后,SAM增强用户多样性偏好与候选商品多样性之间的一致性。从这种增强的一致性中,我们得出一个效用矩阵,该矩阵会动态调整用户偏好,从而重新排序最终的排名结果以更好地满足用户需求。

2.1 PON 用户偏好建模

 

 

在电商搜索场景中,历史查询及其关联商品提供了用户意图的有价值表示。因此,我们的方法不仅包括点击流和加入购物车的行为,还包括查询轨迹,以更好地捕捉用户偏好。

传统模型通常将用户偏好视为静态,在潜在空间中创建固定的用户嵌入。然而,这种方法在捕捉用户偏好的复杂和动态特性时显得不足。相比之下,分布表示引入了不确定性,提供了比单一固定嵌入更多的灵活性。

我们使用多维高斯分布来建模用户偏好的演变趋势。该分布由均值向量和对角协方差矩阵表征,使我们能够更好地捕捉用户偏好的动态特性。此外,高斯分布还可以用于测量收敛和发散趋势。较大的方差表示更均匀的分布,而较小的方差则表示更集中的分布。这个方差可以间接反映用户的偏好趋势。

2.2 SAM 利用互信息优化排序结果

 

 

在建模用户偏好和候选商品的多样性之后,下一步是确保排序结果与用户意图紧密匹配。为此,我们可以使用互信息(一种衡量两个变量之间共享信息量的方法)来量化候选商品与用户偏好之间的相关性。通过最大化这两个因素(用户偏好和多样性)之间的互信息,我们确保候选商品的分布与用户意图的分布紧密对齐。

然而,估计和最大化互信息通常是不可行的。为了解决这一挑战,我们借鉴了变分推理的文献,引入了一个变分后验估计器。该方法允许我们为互信息目标推导出一个可行的下界。

 

 

在增强一致性之后,我们设计了一个可学习的效用矩阵,以进一步使最终的排序结果与用户偏好对齐。该矩阵通过可学习权重矩阵与对齐特征的点积获得。然后,我们将效用矩阵与从主干网络计算的分数相乘以得到最终结果。

2.3 优化函数及最终loss

优化函数:

 

 

 

 

最终loss:

 

 

 

前者是prm分类loss,后者是互信息loss

方案总结:

 

 

2.4 实验结果及可视化分析

 

 

为了验证PODM-MI的有效性,我们在京东电商搜索引擎中进行了在线A/B测试。PODM-MI不仅提高了用户购买的可能性,还增加了搜索结果中商品的多样性。需要注意的是,每增加0.10%的UCVR都会为公司带来巨大的收入,因此PODM-MI取得的提升是非常显著的。

 

 

进一步的,我们对用户query流降维后的趋势使用TSNE可视化,同时降维可视化需要label足够明显,所以采用人工分桶的方法,对排序结果的多样性熵进行人工分桶,分成多个label。可以看出,不同发散收敛趋势的query流有着很明显的分层,query流同对应的熵聚集在了一起,这表明不同的query流的发散趋势对应着不同的结果的熵。也就是说,query流越发散,session的排序结果越发散,query流越收敛,session的排序结果越收敛。

 

 

 

 

此外,我们还用一个更具体的案例来说明我们方法的有效性。当用户的历史搜索查询非常多样时,如:Switch,塞尔达,手机壳,锤子,油烟机,排气管,在这种情况下,当用户输入“蔬菜水果脱水机”后,我们的方法比基线方法产生了更多样化的结果。另外,还有一个收敛趋势的案例。当用户搜索“连衣裙”并访问相应的店铺后,再次输入该店铺时,我们的方法比基线方法产生的结果更加集中,并且更好地与用户的历史搜索记录相匹配。

3、未来迭代方向

• 引入更精细的特征,更好的建模用户的逛买意图

• 用户意图建模更新的进一步优化

• 用户意图建模显式影响

Note:

欢迎大家交流与探讨,如有任何问题或建议,请随时联系:{wanghuimu1, limingming65}@jd.com。

我们京东搜索算法部目前有大量的社招和实习机会,诚邀有志之士加入。无论您是技术专家还是新兴人才,我们都期待您的加入,共同推动技术的进步和创新。欢迎大家踊跃投递简历,期待与您在京东相遇!

团队最近相关工作:

1. Breaking the Hourglass Phenomenon of Residual Quantization: Enhancing the Upper Bound of Generative Retrieval (arxiv:2407.21488)

2. Generative Retrieval with Preference Optimization for E-commerce Search(arxiv:2407.19829)

3. A Preference-oriented Diversity Model Based on Mutual-information in Re-ranking for E-commerce Search(SIGIR 24 ACCEPTED)

4. MODRL-TA: A Multi-Objective Deep Reinforcement Learning Framework for Traffic Allocation in E-Commerce Search(CIKM 24 ACCEPTED)

5. Optimizing E-commerce Search: Toward a Generalizable and Rank-Consistent Pre-Ranking Model(SIGIR 24 ACCEPTED)

 

分享嘉宾:

王彗木博士

中科院自动化所博士,研究方向为大模型、强化学习,亦城优秀人才,CCF 中国计算机学会专业会员,目前在京东从事主搜排序及生成式召排工作

李明明博士

资深算法专家中科院信工所博士,研究方向为大模型、语义检索,亦城优秀人才,CCF 中国计算机学会专业会员,目前在京东从事主搜召回及生成式召排工作

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/787580.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

探索AC自动机:多关键词搜索的原理与应用案例

引言 目前,大多数自由文本搜索技术采用类似于Lucene的策略,通过解析搜索文本为各个组成部分来定位关键词。这种方法在处理少量关键词时表现良好。但当搜索的关键词数量达到10万个或更多时,这种方法的效率会显著下降,尤其是在需要与词典进行详尽对比的场景中。本文将介绍的A…

VL21 根据状态转移表实现时序电路

根据给的状态转移表知道有两个状态:第一列的为current_state,第二三列为next_state,且仅当current_state==11时候Y为1(使用()?:语法实现)。三段式状态机的流程: 第一段:时序逻辑,公式化写法 第二段:组合逻辑,这里要注意always @(*)是固定写法,不能像第一段写成时…

Vue3.5新增的baseWatch让watch函数和Vue组件彻底分手

Vue3.5新增了一个baseWatch,让watch函数和Vue组件彻底分手,他的实现和Vue组件以及生命周期没有一毛钱关系。前言 在Vue 3.5.0-beta.3版本中新增了一个base watch函数,这个函数用法和我们熟知的watch API一模一样。区别就是我们之前用的watch API是和Vue组件以及生命周期是一…

硬件设备snmp配置,snmp如何检测联通信

【1】山石网科防火墙 环境需求:设备与 prometheus 服务器之间需要放通UDP161端口,且网络能连通配置路径:系统——SNMP 1、配置SNMP代理 勾选‘启用’选项,并点击 应用 即可 2、配置SNMP主机 点击‘新建’,添加 zabbix服务器IP地址跟团体名,权限为 只读,点击 确定 完成新…

mmdetection中的dataset pipline

参考: 轻松掌握 MMDetection 整体构建流程(二) 商汤开源目标检测工具箱mmdetection代码详解(三)----------mmdetection数据的输入、处理过程 1. mmdetection中的数据加载流程 pipline中由一系列数据处理模块对数据集进行流水线般的处理要注意的是,上述pipline流程在3.x版本…

南沙信奥赛陈老师讲题:1331:【例1-2】后缀表达式的值

1331:【例1-2】后缀表达式的值 时间限制: 10 ms 内存限制: 65536 KB提交数:65784 通过数: 17299 【题目描述】从键盘读入一个后缀表达式(字符串),只含有0-9组成的运算数及加(+)、减(—)、乘(*)、除(/)四种运算符。每个运算数之间用一个空格隔开,不需要…

windows解决0x80070035找不到网络路径的问题

windows进行网络共享,无法访问,报错0x80070035,找了好几个办法都没有用.无意间尝试开启有密码保护的共享后,成功解决问题. 搜索高级共享->管理高级共享设置->密码保护的共享->勾选有密码保护的共享

使用nginx代理,简单实现一个静态网页功能(扫描二维码)

1、创建项目目录 mkdir my-image-page cd my-image-page2、准备图片和HTML文件上传图片:将 image.jpg 上传到 my-image-page 目录。创建HTML文件:在同一目录下创建一个 index.html 文件<!DOCTYPE html> <html lang="en"> <head><meta charset…

P2757 [国家集训队] 等差子序列 和 CF452F Permutation

讲解 P2757 [国家集训队] 等差子序列 和 CF452F Permutation。考虑枚举中间数,将问题转化为区间判定是否回文,使用线段树与哈希算法解决。题意: 给定一个长度为 \(n\) 的排列 \(a\),判断其中是否有长度 \(\ge 3\) 的等差数列。 \(1 \le n \le 5 \times 10^5\)。 思路: 首…

C# 获取PDF页面大小、方向、旋转角度

在处理PDF文件时,了解页面的大小、方向和旋转角度等信息对于PDF的显示、打印和布局设计至关重要。本文将介绍如何使用免费.NET 库通过C#来读取PDF页面的这些属性。C# 读取PDF页面大小(宽度、高度) C# 判断PDF页面方向 C# 检测PDF页面旋转角度免费库 Free Spire.PDF for .NET…

uni-app小程序(快手、抖音)getCurrentPages使用坑位记录

前情 uni-app是我比较喜欢的跨平台框架,它能开发小程序/H5/APP(安卓/iOS),重要的是对前端开发友好,自带的IDE让开发体验也挺棒的,公司项目就是主推uni-app。 坑位 最近在做一个需求,在达到一定条件的情况下我需要根据路由堆栈中是否有我指定的页面来做不同的跳转,如果路由…

WPF 路由事件2

1什么是路由事件 简单说,路由事件可以沿着视觉树VisualTree进行传递,在这视觉树中的所有对象都可以收到这个事件。前提是添加了检测。 1.1什么是逻辑树LogicalTree 简单理解:逻辑树就是我们在xaml中写的布局逻辑 如xaml代码:<Grid><StackPanel Orientation="…