NPA论文阅读笔记

NPA: Neural News Recommendation with Personalized Attention论文阅读笔记

这个又是一篇很老但是很经典的论文,这里来读一下

Abstract

现存的问题:

​ 不同的用户通常有不同的兴趣爱好,同一用户也可能有不同的兴趣爱好。因此,不同的用户点击同一篇新闻时可能会关注不同的方面。

提出方法:

​ 本文提出了一种具有个性化关注的神经新闻推荐模型(NPA)。我们方法的核心是新闻表示模型和用户表示模型。在新闻表征模型中,我们使用 CNN 网络根据标题学习新闻文章的隐藏表征。在用户表征模型中,我们根据用户点击新闻文章的表征来学习用户表征。

​ 由于不同的单词和不同的新闻文章对于代表新闻和用户来说可能具有不同的信息量,因此我们建议应用单词和新闻级别的关注机制来帮助我们的模型关注重要的单词和新闻文章。此外,同一新闻文章和同一词语对不同用户的信息量也可能不同。因此,我们提出了一种个性化关注网络,利用用户 ID 的嵌入来生成单词和新闻级关注的查询向量。

Introduction

​ 在新闻推荐场景中有两个共同点。首先,用户点击的所有新闻并不能反映用户的偏好。此外,同一新闻对不同用户的信息量也应不同。其次,新闻标题中的不同词语通常对学习新闻表征具有不同的信息量。此外,新闻标题中的相同词语对于揭示不同用户的偏好也可能具有不同的信息量。因此,对不同用户而言,词语和新闻的不同信息量建模可能有助于学习更好的用户表征,从而实现准确的新闻推荐。

​ 在本文中,我们提出了一种用于新闻推荐的个性化关注神经方法(NPA)。我们方法的核心是新闻表示模型和用户表示模型。在新闻表征模型中,我们使用 CNN 网络学习新闻标题的上下文表征;在用户表征模型中,我们从用户点击的新闻中学习用户表征。由于在学习新闻和用户表征时,不同的词语和新闻文章通常具有不同的信息量,因此我们建议在词语和新闻层面应用注意力机制,以选择并突出信息量大的词语和新闻。此外,由于不同用户对相同词语和新闻的信息量可能不尽相同,我们提出了个性化关注网络,将用户 ID 嵌入作为词语级和新闻级关注网络的查询向量,根据用户偏好对重要词语和新闻进行差异化关注。

Method

​ 模型的框架如下:

pk5hCAe.png

​ 在本节中,我们将介绍针对新闻推荐的个性化关注 NPA 方法。我们的模型有三个主要模块。第一个是新闻编码器,旨在学习新闻的表征。第二个模块是用户编码器,旨在根据用户点击新闻的表征学习用户表征。第三个是点击预测器,用于预测一系列候选新闻的点击得分。在新闻编码器和用户编码器模块中,我们在词级和新词级应用了个性化注意力网络,以根据用户偏好选择不同的信息词和新闻。我们的方法架构如上图所示。下面我们将详细介绍我们的方法

新闻编码器

​ 这里分为三个模块

​ 第一个模块是新闻编码器,这里就不多解释了。

​ 第二个模块是CNN,是用来捕捉新闻标题中单词的局部语境来学习其上下文表征。非常经典,具体实现见论文

​ 第三个模块是单词级注意力网络,具体实现如下图:

pk5oJG4.png

​ 在普通非个性化注意力网络中,注意力权重只是通过一个固定的注意力查询向量根据输入表示序列计算出来的,并没有将用户的偏好纳入其中。为了模拟每个词对不同用户推荐的信息量,我们建议使用个性化关注网络,根据用户偏好识别并突出显示新闻标题中的重要词语。

​ 实现的具体公式见论文,这个也是比较简单的注意力机制。

用户编码器

​ 我们方法中的用户编码器模块旨在从用户点击新闻的表征中学习用户表征。在该模块中,新闻级个性化关注模块用于建立信息丰富的用户表征。在学习用户表征时,同一用户点击的新闻通常具有不同的信息量。为了模拟同一新闻对不同用户的不同信息量,我们还对同一用户点击新闻的表征应用了个性化注意力机制。最后获得用户向量。

​ 这个个性化注意力机制也比较简单,具体实现见论文。

点击预测器

​ 用的是比较传统的损失函数计算方式

\(\hat{y}_{i}^{\prime}=\mathbf{r}_{i}^{'T}\mathbf{u},\\\hat{y}_{i}=\frac{\exp(\hat{y}_i^{\prime})}{\sum_{j=0}^K\exp(\hat{y}_j^{\prime})}\)

\(\mathcal{L}=-\sum_{y_j\in\mathcal{S}}\log(\hat{y}_j),\)

总结

​ 这篇文章因为比较老,是五年前的论文了,方法都比较传统,但是写的比较清晰,这里贴一下原文的conclusion

在本文中,我们提出了一种具有个性化关注(NPA)的神经新闻推荐方法。在我们的 NPA 方法中,我们使用 CNN 从标题中学习新闻表示模型,并使用用户表示模型从用户点击的新闻中学习用户表示。由于不同的单词和新闻文章通常对表示新闻和用户具有不同的信息量,我们建议在单词和新闻中同时应用注意力机制,以帮助我们的模型关注重要的单词和新闻文章。此外,由于同样的词语和新闻对不同用户的重要性不同,我们提出了一种个性化的注意力网络,利用用户 ID 的嵌入作为词语级和新闻级注意力网络的查询。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/744107.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[MRCTF2020]Ezaudit 1

信息收集,伪随机数打开之后发现什么按键都没用,直接扫目录得到了两个网址: www.zip login.html <?php header(Content-type:text/html; charset=utf-8); error_reporting(0); if(isset($_POST[login])){$username = $_POST[username];$password = $_POST[password];$Pr…

新一代工程科研效率协同平台peerup

如果您是一位工程师或者科研工作者,相信您一定经历过以下几种情景: 工程类仪器和软件普遍使用门槛很高,大量时间花费在学习使用和数据获取与分析上,而不是创造性工作。软件或仪器产生的数据格式各异,很难进行统一的数据分析与处理。 使用相同仪器,不同行业,公司,项目组…

WAIC 2024,好city啊!

7月4日,“以共商促共享•以善治促善智”为主题的2024世界人工智能大会暨人工智能全球治理高/级别会议(简称“WAIC 2024”)在上海举办。天翼云携智算创新成果精彩亮相世博展览馆,全方位展现在人工智能领域的深厚实力。7月4日,“以共商促共享•以善治促善智”为主题的2024世…

上榜!天翼分布式云操作系统入选“科创中国”先导技术榜单!

在近日召开的第二十六届中国科协年会上,中国科协正式发布2023年“科创中国”系列榜单,榜单包括先导技术榜、新锐企业榜、融通创新组织榜、技术经理人先锋榜等。天翼云自主研发的天翼分布式云操作系统入选先导技术榜,充分展现了在科技创新方面的硬实力。在近日召开的第二十六…

搜索枚举_冯政玮

搜索枚举_冯政玮 A - 循环赛 搜索剪枝 题面 \(n\) 支队伍比赛,每两支队伍比赛一次,平 \(1\) 胜 \(3\) 负 \(0\)。 给出队伍的最终得分,求有多少种可能的分数表。 平1胜3负0指:若两支队伍打平,则各得到 \(1\) 分; 否则,胜利的队伍得到 \(3\) 分,被打败的队伍得到 \(0\) …

探索Nuxt.js的useFetch:高效数据获取与处理指南

摘要:“探索Nuxt.js的useFetch:高效数据获取与处理指南”详述了Nuxt.js中useFetch函数的使用,包括基本用法、动态参数获取、拦截器使用,及参数详解。文章通过示例展示了如何从API获取数据,处理动态参数,自定义请求和响应,以及useFetch和useAsyncData的参数选项,帮助开发…

webrtc-streamer实时播放监控

公司要做web端监控实时播放,经过调研,webrtc-streamer的方式对前后端项目侵入最少,且没有延迟卡钝的现象。 一、准备工作一个摄像头,摄像头对应的rtsp流链接,一台电脑,一个vue项目。 二、Webrtc-streamer安装及启动教程1、下载安装包下载地址:https://github.com/mpromo…

[b01lers2020]Life on Mars 1

sql注入,信息搜集打开之后大脑一片空白,不知道入手点在哪,信息什么都查不到,最后抓包抓到了东西发现抓包的时候出现了两个参数,直接在网页上访问一下发现爆装备了,在这里我卡了挺久的,最后是看其他师傅的wp发现这里是sql注入,就是一个最基础的整形注入,确定了之后我们…

东软徐洪利:应用型数商架起数据要素价值落地桥梁

“数据要素如何变现?” 这是当下东软集团联席总裁徐洪利与业界交流时,最常遇到的问题。 如同工业时代的石油——作为数字时代的生产要素,数据的重要性已经被广泛认可。但是,几乎没有客户会直接购买数据,就如同直接交易石油的生意远远低于购买石油衍生品,如沥青、燃油、塑…

GIS场景编辑如何实现?这款免费可视化工具帮你轻松搞定

在现代智慧城市、智慧交通、智慧农业等各个领域,三维GIS(地理信息系统)需求日益增多。而要实现一个完美的GIS场景编辑,选择一款得心应手的工具至关重要。目前市面上的三维GIS产品有许多,能够对GIS场景进行编辑的产品却不多,那么是否有一款工具能帮助我们进行GIS场景的编辑…

神经网络中神经元的权重更新

前段时间写过一篇介绍神经网络的入门文章:神经网络极简入门。那篇文章介绍了神经网络中的基本概念和原理,并附加了一个示例演示如何实现一个简单的神经网络。 不过,在那篇文章中并没有详细介绍神经网络在训练时,是如何一步步找到每个神经元的最优权重的。本篇介绍神经网络训…