机器学习顶会 NeurIPS 2023 6篇获奖论文速览

噔噔!NeurIPS 2023 今天开奖啦!

防止有些同学不太清楚这个会议,我先简单介绍一下:NeurIPS是机器学习领域的顶级会议,与ICML,ICLR并称为机器学习领域难度最大,水平最高,影响力最强的会议,属于CCF A类。主要涉及机器学习、深度学习、CV、优化方法、神经网络与认知科学、稀疏理论等细分方向。

本次大会共公布了6篇获奖论文及1篇时间检验奖,分别为2篇杰出论文,2篇杰出论文(亚军),1篇杰出数据集论文,以及1篇杰出基准论文。其中关于大模型的研究占多数。

下面就让我们一起来看看这些获奖论文吧!

杰出论文

标题:Privacy Auditing with One (1) Training Run

通过一次培训进行隐私审计

作者:Rylan Schaeffer · Brando Miranda · Sanmi Koyejo

「简述:」本文提出了一种用于审计单次训练过程中具有差分隐私保护的机器学习系统的方案。该方案利用了添加或删除多个独立训练样本的并行性。通过分析差分隐私和统计泛化之间的关系,作者避免了组隐私的成本。该审计方案对算法的假设非常少,可以在黑盒或白盒环境中应用。

标题:Are Emergent Abilities of Large Language Models a Mirage?

大型语言模型的涌现能力是海市蜃楼吗?

作者:Rylan Schaeffer · Brando Miranda · Sanmi Koyejo

「简述:」本文提出了一种替代方案来解释大型语言模型中新兴能力的出现。作者认为,这种能力是由于研究者选择的度量标准不同而产生的,而不是由于模型行为随规模变化所致。作者通过数学模型和三种测试方法来支持该替代方案,并提供证据表明所谓的新兴能力可能不是AI模型规模化的基本属性。

(1)使用InstructGPT/GPT-3族对具有声称新兴能力的任务进行预测、测试和确认三个关于度量标准选择的影响;(2)在BIG-Bench上进行元分析,对新兴能力的度量标准选择进行两个预测并进行测试和确认;(3)展示如何在不同的深度网络中选择度量标准以产生以前从未见过的看似新兴的能力。

杰出论文(亚军)

标题:Scaling Data-Constrained Language Models

在数据受限情况下扩展语言模型的方法

作者:Niklas Muennighoff · Alexander Rush · Boaz Barak · Teven Le Scao · Nouamane Tazi · Aleksandra Piktus · Sampo Pyysalo · Thomas Wolf · Colin Raffel

「简述:」本文研究了在数据受限的情况下如何扩展语言模型。作者运行了一系列实验,变化了重复数据的程度和计算预算,范围从9000亿个训练标记和90亿个参数的模型到最大。作者发现,对于固定的计算预算和有限的数据,最多重复4次的训练与使用唯一的数据相比,对损失的影响可以忽略不计。然而,随着更多重复的出现,增加计算的价值最终会衰减为零。

作者提出了一种可扩展的规律性方法,用于计算最优性,该方法考虑了重复标记和多余参数的递减价值。最后,作者还尝试了一些缓解数据稀缺性的方法,包括使用代码数据扩充训练数据集或删除常用过滤器。

标题:Direct Preference Optimization: Your Language Model is Secretly a Reward Model

你的语言模型实际上是一种奖励模型

作者:Rafael Rafailov · Archit Sharma · Eric Mitchell · Christopher D Manning · Stefano Ermon · Chelsea Finn

「简述:」论文提出了一种名为直接偏好优化(DPO)的新方法,用于微调语言模型以符合人类偏好。这种方法比现有的强化学习方法更简单、更稳定,且效果更好。DPO通过单一阶段的策略训练,就能精确地优化受约束的奖励最大化问题,从而解决了人类偏好数据上的分类问题。实验证明,DPO可以在微调语言模型时,实现对生成情感的控制,提高摘要和对话的响应质量,而且实施和训练更简单。

杰出数据集论文

标题:ClimSim: A large multi-scale dataset for hybrid physics-ML climate emulation

用于混合物理-机器学习气候仿真的多尺度大型数据集

「简述:」ClimSim是一个大型多尺度数据集,用于混合物理和机器学习的气候模拟研究。这个数据集由气候科学家和机器学习研究人员共同开发,包含了57亿对多元输入和输出向量,这些向量能够隔离局部嵌套、高分辨率、高保真物理对主气候模拟器的宏观物理状态的影响。该数据集还覆盖全球范围,跨越多年且采样频率高,旨在使产生的模拟器与下游的气候模拟器兼容。这个数据集的发布将有助于混合物理和机器学习的气候模拟的发展,从而为科学和社会带来利益。

杰出基准论文

标题:DecodingTrust: A Comprehensive Assessment of Trustworthiness in GPT Models

对GPT模型可信度的全面评估

作者:Boxin Wang · Weixin Chen · Hengzhi Pei · Chulin Xie · Mintong Kang · Chenhui Zhang · Chejian Xu · Zidi Xiong · Ritik Dutta · Rylan Schaeffer · Sang Truong · Simran Arora · Mantas Mazeika · Dan Hendrycks · Zinan Lin · Yu Cheng · Sanmi Koyejo · Dawn Song · Bo Li

「简述:」本文提出了一种针对大型语言模型(如GPT-4和GPT-3.5)的全面可信度评估方法,重点关注了毒性、刻板印象偏差、对抗鲁棒性、分布外鲁棒性、对抗演示鲁棒性、隐私、机器伦理和公平性等多个方面。通过评估,作者发现了一些以前未公开的可信度威胁漏洞,例如GPT模型容易受到误导而生成有毒和有偏见的输出,并在训练数据和对话历史中泄露私人信息。此外,尽管GPT-4在标准基准测试上通常比GPT-3.5更可信,但在系统或用户提示下,GPT-4更容易受到攻击,可能是因为GPT-4更精确地遵循(误导性)指令。

时间检验奖

标题:Distributed Representations of Words and Phrases and their Compositionality

单词和短语的分布式表示及其组合性

作者:Tomas Mikolov、Ilya Sutskever、Kai Chen、Greg Corrado、Jeffrey Dean

「简述:」本文介绍了一种高效的连续Skip-gram模型,用于学习高质量的分布式向量表示,该表示可以捕捉大量精确的句法和语义单词关系。作者提出了几种扩展方法,以提高向量质量和训练速度。通过对频繁单词进行子采样,作者获得了显著的加速,并学习了更规律的单词表示。作者还描述了一种名为负采样的简单替代方案,以替代分层softmax。

 

关注下方《学姐带你玩AI》🚀🚀🚀

回复“NeurIPS获奖”获取全部论文+开源代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/268426.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AOP跨模块捕获异常遭CGLIB拦截而继续向上抛出异常

其他系列文章导航 Java基础合集数据结构与算法合集 设计模式合集 多线程合集 分布式合集 ES合集 文章目录 其他系列文章导航 文章目录 前言 一、BUG详情 1.1 报错信息 1.2 接口响应信息 1.3 全局异常处理器的定义 二、排查过程 三、解决方案 四、总结 前言 最近&…

Web安全之XXE漏洞原理及实践学习

一、原理: XXE漏洞全称即XML外部实体注入漏洞。 攻击者强制XML解析器去访问攻击者指定的资源内容(可能是系统上本地文件亦或是远程系统上的文件),导致可加载恶意外部文件,利用file协议造成文件读取、命令执行、内网端口扫描、攻击内网网站等…

Linux高级管理--安装MySQL数据库系统

MySQL服务基础 MySQL.是一个真正的多线程、多用户的SQL数据库服务,凭借其高性能、高可靠和易于使 用的特性,成为服务器领域中最受欢迎的开源数据库系统。在2008年以前,MySOL项目由MySQL AB公司进行开发,发布和支持,之后…

4年外包终上岸,我只能说这类公司能不去就不去......

我大学学的是计算机专业,毕业的时候,对于找工作比较迷茫,也不知道当时怎么想的,一头就扎进了一家外包公司,一干就是4年。现在终于跳槽到了互联网公司了,我想说的是,但凡有点机会,千万…

广州芳村超5亿元“金融茶”爆雷,涉案金额高达5亿元。

昌世茶是一家茶叶厂商,在芳村茶叶市场开展业务。他们通过多位销售人员宣传其茶叶具有巨大的投资价值,并承诺高价回收。投资者被诱以高价购买茶叶,但随后发现价格迅速下跌,且昌世茶不再履行回收承诺。许多投资者因此遭受重大损失。…

靠着这份280页的前端面试指南,拿下了字节跳动offer

笔者是在今年秋招面试的头条教育线,顺利拿到了offer,把还记得的东西写下来,供大家参考一下。 一面 tcp 和 udp 的区别和使用场景?quic 基于 udp 怎么保证可靠性?讲一下同源策略和跨域方案?CORS 的几个头部…

MeterSphere实战(一)

MeterSphere是一位朋友讲到的测试平台,说这东西是开源的,因为我是做测试的,很乐意了解一些新鲜事物。在我看来,测试就是要专注一些领域,然后要啥都会一点点,接着融会贯通起来,这样就可以万变不离…

如何在 Git 中创建分支

1.打开命令行终端,执行以下命令来查看当前分支列表: git branch 显示当前仓库中的所有分支,以及当前所在的分支(显示为带有星号 * 的分支)。 2.创建一个新的分支,可以使用以下命令: git bran…

ABAP: POST 方式建立连接

1、采用APIpost 设置截图如下: ABAP建立调用设置 DATA: lr_http_client TYPE REF TO if_http_client.DATA: l_url TYPE STRING."建立服务 http客户端 CALL METHOD cl_http_client>create_by_urlEXPORTINGurl l_url "连接的地址IMPORTI…

LeetCode面向运气之Javascript—第66题-加1-99.78%

LeetCode第66题-加1 题目要求 给定一个由 整数 组成的 非空 数组所表示的非负整数,在该数的基础上加一。 最高位数字存放在数组的首位, 数组中每个元素只存储单个数字。 举例 输入:digits [1,2,3] 输出:[1,2,4] 输入&#xff…

vue3 echarts 各省地图展示

效果&#xff1a; 1.在src下新建utils文件夹添加各省地图的json文件&#xff08;下载各省地图的网址 DataV.GeoAtlas地理小工具系列&#xff09; 2.安装echarts npm install echarts 3.在项目文件中中引入json <template><div class"back"><div id…

配电站房智慧化改造

随着科技的发展和工业化自动化的不断提高&#xff0c;传统的配电室已经不能满足现代工业的需求。配电站房的智慧化改造可以提高电力系统的运行效率和安全性&#xff0c;依托电易云-智慧电力物联网实现配电房无人值守。以下是配电站房智慧化改造的一些主要方面&#xff1a; 设备…