ONCE论文阅读笔记

ONCE: Boosting Content-based Recommendation with Both Open- and Closed-source Large Language Models论文阅读笔记

Abstract

​ 现有的推荐器在理解项目内容方面面临着巨大挑战。大语言模型(LLM)拥有深层语义理解能力和来自预训练的广泛知识,已被证明在各种自然语言处理任务中非常有效。在本研究中,我们探讨了利用开源和闭源 LLM 增强基于内容的推荐的潜力。对于开源 LLM,我们利用其深层作为内容编码器,在嵌入层丰富内容的表示。对于闭源 LLM,我们采用提示技术来丰富标记层的训练数据。

Introduction

​ 第一段介绍基于内容的推荐系统及其重要性

​ 第二段介绍内容推荐的核心组成部分,内容编码器,并提出缺点

​ 第三段举例介绍以前内容编码器的局限性

​ 第四段提出方法,说GPT能够解决上面的局限性

​ 第五段介绍提出的方法

​ 在本文中,我们研究了通过利用 OpeN- 和 ClosEdsource (ONCE) LLMs 来增强基于内容的推荐的可能性。如图 1 所示,我们的 ONCE 方法针对不同类型的 LLM 采用了不同的策略。对于像 LLaMA 这样的开源 LLM,我们采用了一种名为 DIRE 的鉴别性推荐方法,这让人想起 PLM-NR方法,即用 LLM 取代原始内容编码器。这使我们能够提取内容表征,并专门针对推荐任务对模型进行微调,最终增强用户建模和内容理解能力。相反,对于像 GPT-3.5 这样的闭源 LLM(我们只能访问标记输出),我们提出了一种名为 GENRE 的生成式推荐方法。通过设计各种提示策略,我们丰富了可用的训练数据,并获得了更多信息丰富的文本和用户特征,这有助于提高下游推荐任务的性能。

​ 第六段介绍了实验取得了不错的成果

pAejtf0.png

Method

DIRE:微调开源LLM

​ 在基于内容的推荐中,将开源语言模型整合为内容编码器是一种直接且被广泛采用的方法。值得注意的是,PLM-NR 采用小规模预训练语言模型(PLM,如 BERT)来替代原始新闻编码器,并在推荐任务中进行微调。

​ 这种方法的成功取决于两个因素: 1) 预训练语言模型中固有的知识(包括模型大小和预训练数据质量),以及 2) 微调策略。如前所述,我们已经强调了大型语言模型在内容理解和用户建模方面的优势,从而解决了第一个因素。在本节中,我们将提出鉴别性推荐框架,即 DIRE,并探讨如何利用开源大型语言模型,通过考虑第二个因素来进一步提高推荐性能。

网络结构

​ 如图 3 所示,我们将开源大型语言模型和注意力融合层无缝整合到基于内容的推荐框架中。

pAevpAs.png

嵌入层

​ BERT 等小规模 PLM 采用特定标记(如 ⟨cls⟩、⟨sep⟩)来分割不同字段,而我们则采用自然语言模板来进行连接。例如,考虑一个包含标题、摘要和类别特征等属性的新闻内容𝑛。如图 3 所示,我们在序列的开头引入 “新闻文章:”标签,而每个特征则以“⟨feature⟩”作为前缀。这一过程将多字段内容转化为长度为 𝑙 的有内聚力的单个序列 s。我们将这种技术称为 “自然协整器”。之后,我们利用 LLM 提供的预训练标记嵌入,将离散文本序列映射到维度为 𝑑 𝑛 的连续嵌入空间中,表示为:

\(\mathbf{E^0}=EmbeddingLayer\left(\mathbf{s}\right)\in\mathbb{R}^{l\times d^n}.\)

Transformer解码器

​ LLM (或 LLaMA)的设计基于 Transformer 架构,包含多层 Transformer Layers。这种结构错综复杂地相互连接,每一层的输出隐藏状态都会输入下一层的输入,表示为:

\(\mathbf{E^i}=TransformerLayer\left(\mathbf{E^{i-1}}\right)\in\mathbb{R}^{l\times d^n},i\in\{1,...,H\},\)

注意力融合层

​ 为了将上一层的连续隐藏状态合并为一个具有内聚力的内容表示,我们采用了注意力融合层,该方法与 PLM-NR中使用的方法类似。具体来说,我们首先将高维隐藏状态从一个大维度空间𝑑𝑛 映射到一个较小的d-维空间(其中𝑑𝑛 ≫𝑑),其定义如下:

\(\mathbf{Z=E^iW+b\in\mathbb{R}^{l\times d},}\)

​ 接下来,我们利用加法注意机制,将缩减后的表征进一步浓缩为统一表征 z,其定义为

\(\mathbf{z}=Attention\left(\mathbf{Z}\right)\in\mathbb{R}^d,\)

​ 并将其输入用户建模模块或交互模块,以进行进一步的个性化推荐。

微调策略

​ 这里就不详细讲了,因为作者没有微调的条件,感兴趣见原文,主要策略就是只对最上层的k层进行微调以及采用PET和LoRA的策略。

GENRE:提示闭源LLM

​ 大型语言模型与 BERT 等以往模型的显著不同之处在于其新兴能力,如强大的文本理解和语言生成能力,这导致了从传统的预训练-微调方法到基于提示的方法的范式转变。以往的研究发现,使用提示或上下文学习等方法,将闭源 LLM 直接用作推荐器而不进行微调(完全绕过传统推荐系统),只能达到基本矩阵因式分解方法甚至随机推荐的性能。这与基于注意力的现代方法相比还有差距。

​ 为了克服这一问题,我们提出了一个生成式推荐框架,即 GENRE,如图 4a 所示:利用闭源 LLM(特别是 GPT-3.5)来增强数据,目的是提高它们在下游传统推荐模型中的性能。更确切地说,工作流程包括以下四个步骤。1) 提示:创建提示或指令,利用 LLM 的能力为不同目标生成数据。2) 生成:LLM 根据设计的提示生成新的知识和数据。3) 更新(可选):使用生成的数据更新当前数据,以便进行下一轮提示和生成。4) 训练:利用生成的数据训练新闻推荐模型。如果进行了更新步骤,我们将其命名为 “基于链的生成”,否则,我们将其命名为 “一次生成”。

pAevUUA.png

LLM作为内容摘要

​ 大型语言模型能够将文本内容总结为简洁的短语或句子,这得益于它们在大量自然语言数据和总结任务中的训练。此外,个人姓名和地点等实体在原始数据集中出现的频率可能很低,因此用传统方法学习它们的表征具有挑战性。然而,大型语言模型可以更有效地将它们与预训练时学习到的知识联系起来。

​ 如图 4b 所示,通过提供内容标题、摘要和类别作为输入,大语言模型会生成一个信息量更大的标题作为输出。在下游训练过程中,增强后的内容标题将取代原始标题,并作为内容编码器的输入特征之一(图 3)。

LLM作为用户档案器

​ 用户资料一般指用户的偏好和特征,如年龄、性别、感兴趣的话题和地理位置。由于隐私政策的原因,匿名数据集中通常不提供这些信息。大型语言模型能够理解浏览历史并分析用户资料的轮廓。

​ 如图 4b 所示,大语言模型会根据用户的浏览历史记录生成用户感兴趣的主题和地区。在本例中,GPT-3.5 根据新闻中的 “迈阿密 ”一词推断用户可能对 “佛罗里达 ”地区感兴趣。虽然 “迈阿密 ”在数据集中出现的频率较低,但 “佛罗里达 ”出现的频率较高,因此更有可能与其他新闻或用户联系起来进行协同过滤。

​ 为了将推断出的用户特征纳入推荐模型,我们首先将兴趣主题和兴趣区域融合成一个兴趣向量 v𝑖 ,其定义为

\(\mathbf{v}_i=\left[\mathrm{POOL}\left(\mathbf{E}_{\mathrm{topics}}\right);\mathrm{POOL}\left(\mathbf{E}_{\mathrm{regions}}\right)\right]\in\mathbb{R}^{2\times d},\)

​ 然后,兴趣向量 v𝑖 将与从历史编码器(如图 3 所示)学习到的用户向量 v𝑢 结合,形成兴趣感知用户向量 v𝑖𝑢 如下:

\(\mathbf{v}_{iu}=\mathrm{MLP}\left([\mathbf{v}_u;\mathbf{v}_i]\right)\in\mathbb{R}^d,\)

LLM作为个性化的内容生成器

​ 最近的研究表明,大型语言模型具有从少量示例中学习的卓越能力。因此,我们建议在浏览历史数据非常有限的情况下,使用 GPT-3.5 对用户感兴趣内容的分布进行建模。具体来说,我们将其用作个性化内容生成器,生成新用户可能感兴趣的合成内容,但由于交互数据有限,用户编码器很难捕捉到他们的特征,最终削弱了其为暖用户建模的能力,从而增强了他们的历史交互,使历史编码器能够学习有效的用户表征。

基于链的生成

​ 虽然我们已经展示了几个 “一次生成 ”的例子,但值得注意的是,大型语言模型允许迭代生成和更新。可以利用大型语言模型生成的数据来提高当前数据的质量,然后在下一轮的提示和生成中以迭代的方式加以利用。

​ 我们设计了一种基于链的个性化内容生成器,它将一次性用户剖析器和个性化内容生成器结合在一起。具体来说,我们首先使用 GPT-3.5 生成用户感兴趣的主题和区域,然后结合用户历史记录,促使大语言模型生成合成内容片段。用户资料有助于大语言模型进行链式思考,从而生成比单通道提示更符合用户兴趣的合成内容。

总结

​ 这篇文章的整体推荐框架是基于内容的推荐框架,使用了两种不同的LLM来增强内容的建模。

​ 首先是微调开源的LLM,微调之后的模型作为基于内容推荐框架的内容编码器

​ 然后是对开源的LLM进行提示工程,主要生成三个部分的内容,生成内容摘要作为本文内容进行输入,生成个性化的内容主要是防止冷启动的用户交互数量太少。生成用户档案是输入到历史编码器中。

​ 模型图画的非常清晰,看模型图就能看懂大部分。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/794341.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode刷题笔记9.2-9.9

leetCode刷题笔记(9.2-9.9) 48.旋转图像(9.3) 1)图像即二维数组,图像的旋转本质上是二维数组的旋转变换 2)二维数组从外层来看,是若干个子数组的集合,子数组内部维护各自的元素,即若干个row里是row.length个column 3)由此可理解下面几个关于二维数组的函数:创建二维数…

从零搭建 Docker 私有库

对于涉及机密的公司,不可能提供镜像给公网中的镜像仓库,所以需要创建一个本地私人仓库供给团队使用,基于公司内部项目构建镜像。对于涉及机密的公司,不可能提供镜像给公网中的镜像仓库,所以需要创建一个本地私人仓库供给团队使用,基于公司内部项目构建镜像。 Docker Regi…

[C++ Daily] 确保类复制了所有应该复制的成员

确保类复制了所有应该复制的成员结果:源代码: #include <iostream> #include <string> #include <vector> /*** copy操作应该包含对象内的所有成员变量及所有父类的成员变量,* 此种可以通过调用对应的拷贝构造与拷贝赋值操作完成*//// @brief simple termina…

Docker 知识梳理及其安装使用

Docker 介绍 Docker 是一个强大的工具,用于高效开发、打包和部署应用程序。Docker 是一种容器管理服务。Docker 于 2013 年发布。它是开源的,可用于 Windows、macOS 和 Linux 等不同平台。Docker 正在快速交付、测试和部署代码。这样可以减少编写代码和在生产环境中运行代码之…

硬件功能电路

EEPROMLCD1602电路数码管max485红外开关蜂鸣器译码器移位寄存器步进电机控制复位电路下载电路电源模块温度模块红外热敏电阻交通灯时钟555彩屏矩阵按键单片机烧录电路数码管红外发射显示模块红外接收蜂鸣器驱动流水灯usb供电单片机矩阵单片机电路时钟ADC接口电路单片机电源声音…

BeanShell预处理器获取jmeter请求后变量无法替换

背景 jmeter接口验签逻辑是从请求参数中获取值处理加密验签后,讲请求参数中的sign值替换 如果处理后直接讲sign生成Jmeter变量,在当前请求是无法替换的,因为jmeter请求的URL和body已经运行,不会再重新运行替换解决方法 在当前预处理程序中再写处理当前请求的逻辑// 替换URL…

word 看不到页眉和页脚 以及空白页面的设置

修改文档时,发现递交的文档 不显示 页眉和页脚 以及空白页面的设置在选项卡中勾选jcmaxx33@gmail.com jcmaxx33Team@github

plsql工具无法显示tables问题

每次打开plsql12时tables、views等为空,没有表和视图等 解决办法:选择tool->preferences2、取消勾选最近使用最后重新选择已经登录的用户,就可以正常显示table了

Ftrans无缝替代FTP方案:保障数据传输的安全性与合规性!

FTP(文件传输协议)是一种用于在网络上进行文件传输的标准网络协议,历史悠久并且被广泛使用。但随着业务规模和文件体量的快速增长,在应用实践中,FTP存在一些安全和效率问题。因此政府单位需要可以平滑替代FTP的文件传输解决方案,从而更好的保障数据安全、提升工作效率。具…

Ftrans跨域文件传输方案,数据流动无阻的高效路径!

大型集团企业由于其规模庞大、业务广泛且往往将分支机构、办事处分布在多个地域,因此会涉及到跨域文件传输的需求。主要源于以下几个方面: 1.业务协同:集团内部的不同部门或子公司可能位于不同的地理位置,但需要进行紧密的业务协同。文件传输是实现这种协同的重要方式之一,…

【详解】网络隔离环境下,跨网文件交换存在的核心问题及解决方法

一、为什么要进行网络隔离? 随着互联网技术的发展和推进,人们对于网络使用的场景也越来越多元化,而网络黑客入侵、病毒攻击、网络泄密等安全事件的不断发生,也让人们认识到网络安全的重要性。企业、社会、国家机构在日常经营管理中,由于业务和数据的保密和安全需求,需要对…

明厨亮灶视频监控分析系统

明厨亮灶视频监控分析系统依据“大数据技术明厨亮灶”在基本建设形式上,能够对后厨房的主要地区开展集中统一的视频监控。明厨亮灶视频监控分析系统能够随时随地查看食堂后厨房的监控界面。在厨房工作人员的行为方面,可以识别厨师帽厨师工作服查验,不戴口罩识别,餐厅厨房抽…