DCN V2 Improved Deep Cross Network and Practical Lessons for Web-scale Learning to Rank Systems

news/2024/11/15 6:25:39/文章来源:https://www.cnblogs.com/MTandHJ/p/18386298

目录
  • DCN-v2

Wang R., Shivanna R., Cheng D. Z., Jain S., Lin D., Hong L. and Chi E. D. DCN V2: Improved deep & cross network and practical lessons for web-scale learning to rank systems, 2020.

DCN 的升级版.

DCN-v2

  • DCN-v2 的 cross/deep 的结合方式上有上述两种, 具体的好坏和数据有关系.

  • 相较于 DCN, DCN-v2 的主要改进在于 cross network 部分:

    \[x_{l+1} = x_0 \odot (W_l x_l + b_l) + x_l. \]

    这里 \(W_l \in \mathbb{R}^{d \times d}\), 之前的 DCN 是 \(W_l \in \mathbb{R}^{1 \times d}\).

  • 特别的, 作者发现, 这种方式学出来的 \(W\) 通常是低秩的, 所以对于 \(W_l\) 做了进一步的改进:

    \[W_l = U_l V_l^T, \quad U_l, V_l \in \mathbb{R}^{d \times r}, \quad r \ll d, \quad r \ll d. \]

  • 同时, 引入 MoE 机制:

    \[x_{l+1} = \sum_{i=1}^K G_i(x_l) E_i(x_l) + x_l, \]

    其中 \(G_i(\cdot)\) 得到对第 i 个专家的权重 (通过 sigmoid, softmax 等实现), \(E_i\) 则定义如下:

    \[E_i(x_l) = x_0 \odot \big(U_l^i \cdot g(C_l^i \cdot g({V_l^i}^T x_l)) + b_l \big). \]

    这是对在压缩到低维空间后通过非线性激活函数 \(g(\cdot)\)\(C_l^i\) 仅进一步的转换.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/789030.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

非结构化文档解析

参考:RAG效果优化:高质量文档解析详解知识库 RAG的核心之一就是知识库的离线存储,如何将非结构化文档存储是非常重要的。PDF和Word文件结构word文件解析pdf文件解析Papermage介绍总结阿里云上的文件解析方法示例准确率参考

ChatMoney让你变成HR高手!

本文由 ChatMoney团队出品在快节奏的现代职场中,招聘是每一个企业都绕不开的重要环节。然而,传统的招聘流程往往繁琐而低效,从海量简历的筛选,再到后续的评估与决策,每一个环节都耗费着HR人员大量的时间和精力。幸运的是,随着人工智能技术的飞速发展,AI人力资源顾问正逐…

告别繁琐招聘,AI人力资源顾问让你秒变HR高手!

本文由 ChatMoney团队出品在快节奏的现代职场中,招聘是每一个企业都绕不开的重要环节。然而,传统的招聘流程往往繁琐而低效,从海量简历的筛选,再到后续的评估与决策,每一个环节都耗费着HR人员大量的时间和精力。幸运的是,随着人工智能技术的飞速发展,AI人力资源顾问正逐…

【整理】【网络基础知识】数字签名

数字签名的特点: 接收者能够核实发送者对报文的签名。报文鉴别 接收者确信所收到的数据和发送者发送的完全一样没有被篡改过。报文的完整性 发送者事后不能抵赖对报文的签名。不可否认秘钥分配(KDC,CA):参考🔗: https://mp.weixin.qq.com/s/e7jBXV2ukLqIj6l42jew7A

24 个很棒的开源 Rust 项目

【转】https://devpress.csdn.net/opensource/62f483cd7e668234661885ef.html 24 个很棒的开源 Rust 项目 Rust 有一个非常活跃和快节奏的开源生态系统,有大量的贡献者致力于大量的很棒的项目。 如果你问——我可以在 Rust 中构建什么?答案几乎是一切。 本文将介绍一些开源 Ru…

【Visual Studio】安装SVN插件

前期准备 已有SVN服务器路径账号、密码或本机上已安装SVN Server 在本机安装TortoiseSVN(即SVN客户端) 网址 安装地址:https://www.visualsvn.com/visualsvn/download/ 。选择自己的Visual Studiod对应的版本。关闭VS。按步骤安装好,即可 有志者,事竟成,破釜沉舟,百二秦…

SINGLE论文阅读笔记

Modeling User Viewing Flow Using Large Language Models for Article Recommendation论文阅读笔记 Abstract ​ 本文针对文章推荐任务提出了用户浏览流建模方法(SINGLE),该方法从用户点击的文章中建立用户恒定偏好和即时兴趣模型。具体来说,我们首先采用用户恒定浏览流建…

产品经理面试宝典:阿里、字节、百度、腾讯、拼多多等全国顶级大厂面试题一网打尽!

​在互联网行业蓬勃发展的今天,产品经理作为连接技术、设计和市场的核心角色,其重要性日益凸显。想要进入国内顶尖的互联网大厂,如阿里巴巴、字节跳动、百度、腾讯、拼多多等,产品经理岗位的面试无疑是一场硬仗。本文将为你揭秘这些大厂的产品经理面试真题,并提供参考答案…

袋鼠云《数据资产管理白皮书》重磅发布,提供数据资产管理新思路,激发数据资产新动能(附下载)

近年来,政府将数据要素纳入了经济发展的重要指示性文件当中,数据作为一种新型生产要素,已经成为第五大生产要素。 要实现数据要素的市场效能,真正发挥数据生产要素的作用,离不开数据资产化,而数据资产化自然也离不开数据资产管理这一基础工作。数据资产管理是释放数据要素…

设置程序开机自动启动

win+R输入shell:startup 把需要开机自动启动的程序的快捷方式拖进去即可.

Maven篇

1、什么是 maven ? maven 主要服务于基于 java 平台的项目构建,依赖管理和项目信息管理。 maven 项目对象模型(POM),可以通过一小段描述信息来管理项目的构建,报告和文档的项目管理工具软件。它包含了一个项目对象模型,一组标准集合,一个项目生命周期,一个依赖管理系统…

【C#】【WinForm】启动报错 “lc.exe”已退出,代码为 -1

启动项目时报错 “lc.exe”已退出,代码为 -1,这个原因是项目需要认证的凭证,有两种方法解决. 1. 手动搜索license,然后删掉即可 2.工具->nuget包管理->管理解决方案的nuget包,搜emptylicenses,找到emptylicenseslicx下载安装就行。 有志者,事竟成,破釜沉舟,百二…