【博士每天一篇文献-实验】Is a Modular Architecture Enough?

阅读时间:2023-11-26

1 介绍

年份:2022
作者:Sarthak Mittal,Yoshua Bengio,蒙特利尔大学
期刊: Advances in Neural Information Processing Systems
引用量:22
这篇论文探讨了模块化架构在机器学习系统中的有效性,灵感来自人类认知中的稀疏性和模块化性。作者强调了模块化架构在泛化能力、可扩展性、学习速度和可解释性方面的优势。他们提出评估指标,通过合成数据分布评估常见模块化架构的性能,重点关注模块化和稀疏性。通过分析不同的模型架构,如MLP、MHA和RNN,作者研究了模块化系统的专业化和性能。该文旨在深入了解模块化系统的工作原理和可以提高其性能的归纳偏差。通过详细的实验和分析析,作者观察到模块化系统中的专业化可以显著增强性能,特别是在具有许多基本规则的任务中。该文中开发的评估指标揭示了当前模块化系统的优势和劣势,暗示了需要额外的归纳偏差来优化性能。

2 创新点

(1)通过系统性和广泛的实验,展示了当支持良好且分布式专业化时,模块化的特性可以在内外分布测试中超越单体模型。
(2)提出了针对模块化体系结构常见组成部分的评估、量化和分析的原则性方法,并通过一系列模型对一系列基于标准MLP样式连接、循环连接或注意力操作(Bahdanau等人,2015; Vaswani等人,2017)支持的模块化网络的有效性进行了探究。
(3)发现模块化系统中的专业化在任务中存在许多基础规则时,可以显著提高性能,但在只有少量规则时效果不明显。

3 算法

在这里插入图片描述

(1)数据生成
数据生成过程。使用了简单的专家混合模型(MoE)Yuksel等人(2012);Masoudnia和Ebrahimpour(2014)风格的数据生成过程(混合分布)。
(2)三种模型架构
三种模型架构MLP、多头自注意力(Multi-Head Attention,MHA)和RNN

4 思考

这里提到的模块化,是指的程序的模块化?而不是储层中的节点模块化,这里指的粒度更大。
有源码,可以看一下源码,其中的模块化是如何做的。
GitHub 地址:https://github.com/sarthmit/Mod_Arch

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/521420.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java中SpringBoot四大核心组件是什么

一、Spring Boot Starter 1.1 Starter的应用示例 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-thymeleaf</artifactId> </dependency> <dependency><groupId>org.mybatis.sprin…

php反序列化-字符逃逸看这一篇就够了

反序列化的特性 <?php /* $_SESSION["user"] guest; $_SESSION[function] highlight_file; $_SESSION[img] base64_encode(/d0g3_fllllllag); //d0g3_f1ag.php $serialize_info serialize($_SESSION);echo $serialize_info;*/$str a:3:{s:4:"user&quo…

unity学习(51)——服务器三次注册限制以及数据库化角色信息6--完结

同一账号只写第一次&#xff0c;不同账号第一次爆炸 &#xff0c;就因为下面部分得到逻辑有问题 修改后的代码如下&#xff1a;1.成功完成角色注册信息的数据库化记录。2.每个账号上限3个角色。3.角色是可以重名的&#xff0c;但是角色的id不会重名。 internal class UserCach…

酷克数据荣获粤港澳大湾区金融创新成果“特优解决方案”奖

近日&#xff0c;“第二届金融创新优秀应用案例与解决方案技术成果评定”正式揭晓&#xff0c;酷克数据提交的“HashData云原生金融信创数据仓库”入选特优解决方案&#xff0c;成为数据治理与数据平台类目中唯一的厂商方案。 本次评定历时5个多月&#xff0c;共257个项目参与申…

为什么TikTok视频0播放?账号权重提高要重视

许多TikTok账号运营者都会遇到一个难题&#xff0c;那就是视频要么播放量很低&#xff0c;要么0播放&#xff01;不管内容做的多好&#xff0c;最好都是竹篮打水一场空&#xff01;其实你可能忽略了一个问题&#xff0c;那就是账号权重。下面好好跟大家讲讲这个东西&#xff01…

《拓跋氏后裔的诅咒》——献给奋斗中的女性

近日&#xff0c;一部描绘北方农村女性成长与觉醒的长篇小说《拓跋氏后裔的诅咒》引起了广泛关注。这部作品由北京儿童医院的医生张鹏飞历时四年精心创作&#xff0c;由作家出版社出版。小说通过一个具有代表性的北方农村女性的视角&#xff0c;展现了现代社会中女性地位的提升…

直播相机,AI纪元!云犀首款AI直播相机重磅发布!

3月7日晚&#xff0c;云犀重磅发布首款AI直播相机-云犀智瞳Pro&#xff01;据悉该相机内置了云犀首款AI直播调参大模型&#xff0c;能够通过AI分析智能调节直播间参数&#xff0c;赋予直播间画面AI智能调控能力。 云犀AI直播相机&#xff0c;让直播更简单 此次云犀AI直播相机的…

Mysql 学习(十五)redo 日志

redo 日志 什么是redo日志&#xff1f;在说这个之前我们先来想一个场景&#xff0c;在访问磁盘的页面之前&#xff0c;我们会先把页面缓存到Buffer Pool之后&#xff0c;才会访问。写页面的时候也会先将buffer pool中的页面修改之后&#xff0c;然后在某个时机才会刷新到磁盘中…

Linux基础IO【 详 解 】

文章目录 C语言文件IOC语言文件接口汇总默认打开的三个流 系统文件IOopenclosewriteread 文件描述符fd文件描述符的分配规则重定向重定向的本质dup2 FILEFILE当中的文件描述符FILE当中的缓冲区 理解文件系统初识inode磁盘分区与格式化介绍 软硬链接软链接硬链接软硬链接的区别 …

国家妇女节放假是法定的假日

在这个充满活力和希望的春天&#xff0c;我们迎来了一个特殊的节日——国家妇女节。这是一个属于所有女性的节日&#xff0c;是一个庆祝女性成就、关爱女性权益的时刻。在这个特殊的日子里&#xff0c;我们不禁要问&#xff1a;国家妇女节放假是法定假日吗&#xff1f;让我们一…

从新能源汽车行业自动驾驶技术去看AI的发展未来趋势

自动驾驶汽车关键技术主要包括环境感知、精准定位、决策与规划、控制与执行、高精地图与车联网V2X以及自动驾驶汽车测试与验证技术等。 &#x1f413; 自动驾驶技术 这是AI在汽车行业中应用最广泛的领域之一。自动驾驶技术利用AI算法和传感器来感知环境、识别障碍物&#xff0c…

vue 使用element plus 菜单时,折叠文字不消失

问题&#xff1a; 菜单折叠时&#xff0c;title文本无法消失&#xff0c;同时下拉箭头还会存在 解决方法&#xff1a; 查看项目中是否有div标签 原因 div和p标签都是块级元素&#xff0c;可能是这个原因 所以把项目中的p标签改为span标签 div改为template即可解决