首页HF粗排模型优化

[work@ rus_env]$ pwd
/home/work/xx/du-rus/offline-tools/du_rus/rus_env

[work@ rus_env]$

python buildenv_rus.py  5a0e771e938a486df3b8b3e1cde1a39c2006882d 5f3241963a3e39a8e1eae05d7075fc5b9278a7c7

打开日志级别

[work@xx conf]$

vim /home/work/xx/du-rus/du_rus_offline/conf/log.conf

第31行rpc.log 追加,TRACE,DEBUG

     31 RPC_SELFLEVEL : NOTICE,TRACE,DEBUG

重启服务

/home/work/xx/du-rus/du_rus_offline/bin

./server_control stop  暂停服务

./server_control start  启动服务

小流量

模型预测:506987_507013

recaller分布不变:507017_507013

source_type分布不变:506985_507013

recaller_source_type分布不变:507016_507013

对照组:507013

模块验证

前置规则(pre_process)

  1. debug信息
    postman连接测试环境,请求体中isDebug设置为true,在response中搜索homefeed_items_feature

[work@nj02-ps-wwwda13-n1.nj02.baidu.com log]$ vim /home/work/xx/du-rus/du_rus_offline/log/rpc.log

日志查询  

模型预测

 1. 无法排序资源跳过模型预测
小流量输入506987_507013
postman连接测试环境,日志中搜索"before extract_specific_sourcetype_cands cands len is" → A   日志结果为579

  

2. 日志中搜索"after extract_specific_sourcetype_cands cands len is" → B  日志结果为537

3. 日志中搜索"target_cands len is" → C
必须保证A-B=C

  


且资源的source_type为vod和news是会跳过预测,即这两种情况下日志中会出现"this item has been move to target_cands"

​4. 模型预测
小流量输入506987_507013
日志中
不会出现"model_manager->regress fail"
日志中搜索"candidate_id:"查看每个candidate的打分


排序

1. 基于模型预测/recaller分布不变的结果排序(单纯按照分数排序)小流量输入模型预测对应小流量506987_507013,查看排序前candidates

日志搜索"pre rough_ranking is"分数无序​

日志搜索"post rough_ranking is",分数一定是降序排序

2. 基于recaller_source_type分布不变507017_507013的结果排序(同recaller+source_type下的资源进行排序)

流量输入模型预测对应小流量,查看排序前candidates,日志搜索"pre rough_ranking is",同上
分数无序

日志搜索"post rough_ranking is",对应排序前和排序后资源的排序方式是同recaller+source_type下的排序
分数降序

3. 基于source_type分布不变506985_507013的结果排序(根据recaller_min_quota_conf读取每个recaller quota,保证quota内资源排序前后source_type分布不变)

小流量输入模型预测对应小流量,日志中搜索"cands len is",即输入排序模块的Candidate个数

日志中搜索"global_source_type_distribution is",查看排序前topk资源的分布

日志中搜索"top_reserve_num_candidates len is",查看排序后资源数量总和,一定保证总和和上面topk资源数量总和相同

4. 日志中搜索"check_source_type_distribution is",查看排序后topk资源的source_type分布,一定保证和排序前topk资源的分布是相同的
 

quota

1. 基于模型预测/source_type分布不变的quota配置
小流量输入模型预测对应小流量506987_507013,日志中搜索不到"in select_topk"

2. 基于recaller分布不变/recaller_source_type分布不变的quota配置   
小流量输入模型预测对应小流量,日志中搜索到"in select_topk"

测试结论

通过

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/577046.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【智能家居项目】RT-Thread版本——DHT11获取温湿度 | MQTT上传到服务器 | 服务器控制外设

🐱作者:一只大喵咪1201 🐱专栏:《智能家居项目》 🔥格言:你只管努力,剩下的交给时间! 这篇文章中,本喵将使用RT-Thread Studio来实现这个智能家居的项目,最终…

Xline command 去重机制(二)—— RIFL 实现

在上一篇文章Xline command 去重机制(一)—— RIFL 介绍中,我们从 command 去重机制的契机开始,介绍了去重的必要性以及目前 Xline 的去重机制存在的一些问题,同时讲解了 RIFL(Reusable Infrastructure for Linearizab…

华清远见STM32U5开发板助力2024嵌入式大赛ST赛道智能可穿戴设备及IOT选题项目开发

第七届(2024)全国大学生嵌入式芯片与系统设计竞赛(以下简称“大赛”)已经拉开帷幕,大赛的报名热潮正席卷而来,高校电子电气类相关专业(电子、信息、计算机、自动化、电气、仪科等)全…

大话设计模式之策略模式

策略模式是一种行为设计模式,它允许在运行时选择算法的行为。这种模式定义了一族算法,将每个算法都封装起来,并且使它们之间可以互相替换。 在策略模式中,一个类的行为或其算法可以在运行时改变。这种模式包含以下角色&#xff1…

零拷贝技术探讨

零拷贝技术是一种用于提高数据传输效率的网络技术,主要应用于网络服务器中。它通过减少数据在操作系统内核空间和用户空间之间的复制次数来提高性能。 在传统的网络服务器中,当客户端向服务器发送请求时,服务器会从磁盘读取数据,…

武汉星起航:借亚马逊平台优势助力商家精准营销

在全球经济一体化的背景下,跨境电商已成为推动国际贸易发展的重要引擎。作为跨境电商领域的佼佼者,亚马逊平台以其全球化销售渠道和强大的数据分析能力,为商家提供了前所未有的商机。武汉星起航电子商务有限公司深知亚马逊平台的优势&#xf…

2024最新Guitar Pro 8.1中文版永久许可证激活

Guitar Pro是一款非常受欢迎的音乐制作软件,它可以帮助用户创建和编辑各种音乐曲谱。从其诞生以来就送专门为了编写吉他谱而研发迭代的。 尽管这款产品可能已经成为全球最受欢迎的吉他打谱软件,在编写吉他六线谱和乐队总谱中始终处于行业领先地位&#x…

MySQK索引

1.认识索引 索引:提高数据库的性能,索引是物美价廉的东西了。不用加内存,不用改程序,不用调sql,只要执行正确的 create index ,查询速度就可能提高成百上千倍。但是天下没有免费的午餐,查询速度…

Aurora IP的Framing帧接口和Streaming流接口

本文介绍Aurora IP配置时要选择的接口类型以及两种接口类型之前的区别。 Aurora IP接口有两种模式:Framing帧接口,Streaming流接口 目前一直在用的都是Framing帧接口。 Framing帧接口和Streaming流接口的主要区别是什么呢? 顾名思义&#x…

气象预测新篇章:Python人工智能的变革力量

Python是功能强大、免费、开源,实现面向对象的编程语言,在数据处理、科学计算、数学建模、数据挖掘和数据可视化方面具备优异的性能,这些优势使得Python在气象、海洋、地理、气候、水文和生态等地学领域的科研和工程项目中得到广泛应用。可以…

win10微软拼音输入法 - bug - 在PATH变量为空的情况下,无法输入中文

文章目录 win10微软拼音输入法 - bug - 在PATH变量为空的情况下,无法输入中文概述笔记实验前提条件100%可以重现 - 无法使用win10拼音输入法输入中文替代的输入法软件备注备注END win10微软拼音输入法 - bug - 在PATH变量为空的情况下,无法输入中文 概述…

【数据结构 | 图论】如何用链式前向星存图(保姆级教程,详细图解+完整代码)

一、概述 链式前向星是一种用于存储图的数据结构,特别适合于存储稀疏图,它可以有效地存储图的边和节点信息,以及边的权重。 它的主要思想是将每个节点的所有出边存储在一起,通过数组的方式连接(类似静态数组实现链表…