小红书 X WSDM 2024「对话式多文档问答挑战赛」火热开赛!

基于大语言模型(LLM)的对话问答机器人,已经成为当前人工智能领域学术界和工业界共同关注的的热门研究方向之一。在对话过程中,为大模型引入搜索结果,进行检索增强的生成(Retrieval Augmented Generation,RAG),能够有效缓解大模型的幻觉问题,提升回答质量。尽管 RAG 大幅提升了对话问答的准确率,但是依然存在对检索结果利用不充分,上下文理解错误等具有挑战的问题。

作为中国最具标志性的社交媒体平台之一,小红书集结图片、文字、视频和直播等多种内容形式于一体,一直致力于不断提升用户的搜索体验。2024 年,小红书技术团队联合数据挖掘顶会 WSDM (ACM International Conference on Web Search and Data Mining),共同发起「WSDM Cup 2024 : 对话式多文档问答挑战赛」,期待各位技术豪杰前来挑战!

本次挑战赛采取线上参与形式,组委会将提供一系列与真实世界数据相关的文档,并根据模型在语义和词汇相关性方面的表现来评估。前三名获胜团队将分别获得 2000 美元、1000 美元和 500 美元的奖金,并被邀请至墨西哥参会,展示其解决方案。

图片

关于 WSDM

WSDM 是信息检索与数据挖掘领域的国际顶级会议,由国际计算机学会(ACM)下属的信息检索(SIGIR)、数据挖掘(SIGKDD)、数据库(SIGMOD)与网络信息处理(SIGWEB)等四个专委会共同举办,涵盖信息检索、数据挖掘、Web 搜索、社交媒体、推荐系统等领域的前沿研究,在互联网搜索和数据挖掘领域拥有极高的学术声誉。第17 届 ACM 国际 WSDM 会议于 2024 年 3 月 4 日至 3 月 8 日在墨西哥举行,WSDM Cup 2024 旨在为全球参赛者提供真实工业环境下开展算法评测和研究的平台。

「对话式多文档问答」挑战赛

Conversational Multi-Doc QA

 赛题任务

每个月有数以亿计的用户在小红书上分享和发现生活的美好,并在小红书海量笔记中获取相关信息和实用的生活经验。小红书利用先进的 AI 技术,如深度学习及时下流行的大语言模型等,提升用户个性化的互动体验,更好地满足他们对高效、准确信息获取的需求。


在多轮对话场景中,为用户的查询提供准确且全面的回答是一项充满挑战的任务,在本次比赛中,我们将模拟真实的多轮对话场景,提供对话历史、当前查询 query、以及搜索系统检索到的相关笔记。参赛者的系统被要求依据这些输入信息,理解用户查询意图并输出面向查询 query 的文本回答。我们将评估回答的准确性与完善性。通过这个挑战,期待能探索和提高对话系统在面对多轮上下文和多样化搜索结果时,生成更准确,完善回答的能力,更好地理解和满足用户的需求,获取更加高效、准确的信息。

 特别说明

模型需要根据对话历史和提供的参考文档来回答用户问题。

输入:历史记录,参考文档,问题。输出:回答。

模型规模要求:确保模型大小不超过 140 亿(14B)参数。整体解决方案将在提交截止日期后进行审查。

 赛题议程

● 2023 年 12 月 25 日

赛事启动第一阶段(评估集),开放报名组队。

 2024 年 2 月 1 日

转入第二阶段(测试集),在该阶段获得的排名将用于确定最终奖项名单。同时,关闭竞赛注册通道。

● 2024 年 2 月 15 日(太平洋时间 23:59)

第二阶段停止提交结果。

● 2024 年 3 月 4 日至 8 日

在墨西哥举办 WSDM 2024「对话式多文档问答挑战赛」研讨会,期待前三名获胜团队的分享。

奖项设置

冠军队伍: 一支 ( $2000 )

亚军队伍: 一支 ( $1000 )

季军队伍: 一支 ( $500 )

报名参赛

  • 本次大赛面向全社会开放,不限年龄、身份、国籍,相关领域的个人、高等院校、科研机构、企业单位、初创团队等均可报名参赛。
  • 大赛主办单位中有机会提前接触赛题和数据的人员不得参加比赛,其他员工可以参与比赛排名,但不可领取任何奖项。
  • 评审规则、赛题 Demo、结果提交要求等更多信息可见大赛官网。
  • 大赛官网:https://sites.google.com/view/wsdm24-docqa/home
  • WSDM 2024:https://www.wsdm-conference.org/2024/wsdm-cup/

图片

                                       

欢迎各路高手同台竞技,期待你的参与!

图片

WSDM Cup 2024 : 对话式多文档问答挑战赛」由小红书社区搜索团队倾力呈现!社区搜索团队负责小红书搜索效果的优化和前沿技术的探索,致力于打造中国最大的生活搜索引擎。

团队利用最先进的生成式大模型、问答对话、多模态、大规模CTR 预估、海量 ANN 索引、流式机器学习框架等技术,通过优化 Query 分析、内容理解、召回排序、相关性、预估等方向,为海量用户提供精准、快捷、智能化、个性化的搜索体验。我们期待具有探索精神的你,加入我们,并肩面对挑战性拉满的新一代搜索引擎优化任务。

小红书社区搜索算法工程师

岗位职责:

1、对小红书搜索效果进行优化,包括搜索算法和策略的调研、设计、开发、评估等环节,提升用户体验;

2、发现并解决搜索场景中在查询分析、意图识别、排序模型、去重等方向的问题;

3、解决小红书搜索实际问题,更好地满足用户的搜索需求;

4、跟进业内搜索相关模型和算法的前沿进展,并在实际业务中进行合理应用。

任职资格:

1、本科及以上学历,计算机相关专业背景;

2、有搜索、推荐、广告、图像识别等相关背景优先;

3、熟悉机器学习、NLP、数据挖掘、知识工程的经典算法,并能在业务中灵活解决实际问题;

4、在国际顶级会议(KDD、SIGIR、WSDM、ICML、ACL等)以第一作者发表过高水平论文者、知名数据挖掘比赛(例如 KDD Cup 等)中取得领先名次者优先;

5、积极向上,踏实勤奋,自我驱动,善于沟通,解决问题优先。

欢迎感兴趣的同学发送简历至REDtech@xiaohongshu.com,并抄送至luyun2@xiaohongshu.com。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/326473.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NVIDIA Jetpack6.0DP使用过程中的问题

Jetpack6.0DP是2023年12月才发布, 操作系统使用了ubuntu 22.04, gcc是11.4,版本都很高, 用起来还存在一些问题 无法使用jtop https://forums.developer.nvidia.com/t/jtop-no-longer-works-on-jp-6-0-dp/275215 使用$ sudo -H p…

写给自己的CSDN博客之旅-如何从过程中获取价值-

勇于尝试 一个普通人如何在竞争越来越激烈的现代社会找到安身立业的方式? 作为一个注册CSDN已经有19年的老人,这些年失败的经历实在是太多太多了。 虽然注册CSDN很早,但是写博客确是在工作之后,也就是2015年。 在此之前有很多失…

什么?谁?w (who what)

文章目录 什么?谁?w (who & what)默认的显示不显示标题行简洁模式显示更多信息 什么?谁?w (who & what) w可以认为是加强版的who,果然越简洁越强大,就比如less比more是功能更多的。 w不仅可以显示…

Linux 上 Nginx 配置访问 web 服务器及配置 https 访问配置过程记录

目录 一、前言说明二、配置思路三、开始修改配置四、结尾 一、前言说明 最近自己搭建了个 Blog 网站,想把网站部署到服务器上面,本文记录一下搭建过程中 Nginx 配置请求转发的过程。 二、配置思路 web项目已经在服务器上面运行起来了,运行的端…

[概率论]重生至期末考前一个月看我如何力挽狂澜(下)

课本为《概率论与数理统计》ISBN 978-7-301-29547-2,此次整理4-8章的内容。 第四章 随机变量的数字特征 期望 频率具有波动性,概率具有稳定性。 离散型 设X是离散型随机变量,其分布律为:P{Xxk}pk ,k0,1,2,…… 两点分布 E(X)…

JavaScrip-初识JavaScript-知识点

初识JavaScript 编程基础编程计算机语言标记语言编译器&解释器 计算机基础计算机组成数据存储数据存储单位程序运行 认识JavaScript什么是JavaScriptJavaScript作用HTML&CSS&JavaScript的关系浏览器执行JavaScript过程JavaScript的组成JavaScript初体验 JavaScript…

轻松获取CHATGPT API:免费、无验证、带实例

免费获取和使用ChatGPT API的方法 快速开始:视频教程 章节一:GPT-API-Free开源项目介绍 GPT-API-Free 是一个开源项目,它提供了一个中转API KEY,使用户能够调用多个GPT模型,包括gpt-3.5-turbo、embedding和gpt-4。这…

LauraGPT

git:https://github.com/alibaba-damo-academy/FunCodec 文章目录 model archAudioTokenizermodel init model arch text-embedding 用千问的模型参数初始化;AudioEncoder用asr-conformer的参数初始化;所有的参数都参与更新,除了C…

CentOS未能挂起虚拟机

问题: CentOS未能挂起虚拟机 解决方案: 1、切换到root 2、打开/etc/selinux/config 3、编辑fonfig文件SELINUXpermissive 4、重启VMware(很重要!!!简单粗暴,直接右上角x关机。) …

快速入门Visual Studio 2022开发.Net Framework研发环境指南

IDE工具 Visual Studio 2022 Vs2022企业版 - VisualStudioSetup.exe Visual Studio Code VSCodeUserSetup-x64-1.66.2.exeVSCodeUserSetup-x64-1.67.0-insider.exe IDE环境 编程字体YaHei.Consolas YaHei.Consolas.1.12.ttf IDE插件 Visual Studio Code常用插件 Chinese…

抖音字幕视频怎么做能滚动 抖音个性字幕怎么做 抖音短视频用什么软件剪辑

不管是抖音短视频,还是其他影视网站的影视剧,字幕基本都是必不可少的,字幕本身就能加强观众对视频的理解,而且像一些滚动字幕,会更加吸引观众的注意力,那抖音字幕视频怎么做能滚动?抖音个性字幕…

63.接口安全设计(活动管理系统:三)

文章目录 一、参数校验二、统一封装返回值三、做权限控制四、加验证码五、 限流六、加ip白名单七、校验敏感词八、使用https协议九、数据加密十、做风险控制 在日常工作中,开发接口是必不可少的事情,无论是RPC接口还是HTTP接口,我们都应该考虑…