DREAM: A Dynamic Scheduler for Dynamic Real-time Multi-model ML Workloads——论文泛读

ASPLOS 2024 Paper 论文阅读笔记整理

问题

新兴的实时多模型ML(RTMM)工作负载,如AR/VR和无人机控制,涉及各种粒度的动态行为:任务、模型和模型中的层。这种动态行为给ML系统中的系统软件带来了新的挑战,与传统的ML工作负载不同,总体系统负载不是完全可预测的。此外,RTMM工作负载需要实时处理,涉及高度异构的模型,并以资源受限的设备为目标。考虑到RTMM工作负载的独特特性,需要开发一个有效的调度器来更好地利用底层硬件。

挑战

面对一些新的挑战:(1)来自不同任务和多模态传感器输入的高度异构的ML模型(例如,模型大小、算子和张量大小);(2)不同级别的丰富动态性;(3)复杂的模型级数据和控制依赖性;(4)目标设备(例如,AR眼镜)中的计算能力和能量受限;(5)实时要求。

现有方法不能满足RTMM的各种挑战

本文方法

本文提出了调度器DREAM,可以有效地处理RTMM系统中实时性、并发性、多模型、多任务的挑战。

  • 对于实时性和并发性,提出了MapScore评分指标,该指标同时考虑了紧迫性和公平性,有助于优化特定任务性能的和所有任务的整体性能。

  • 对于级联模型的复杂依赖,跟踪输入帧内和多个帧之间的模型依赖性。

  • 对于动态性,开发了具有可调参数的动态调度方法,可以快速有效地适应工作负载的变化。

  • 支持各种基于加速器的ML系统,包括具有异构大小和数据流的多加速器。

  • 提出一种抢先丢帧方法,当预计会违反截止日期时,该方法会提前丢帧,有助于跨帧和模型进行全局优化。

  • RTMM背景下的超网切换探索[4],该超网利用权重共享超网,在重系统负载下动态切换到较轻的模型变体来改进ML系统调度器,也促进了全局范围内的优化。

在五种RTMM工作负载场景的评估中,与最先进的基线相比,DREAM将总体UXCost(RTMM的能量延迟乘积(EDP)的等效度量)的几何平均值分别降低了32.2%和50.0%。

实验

实验环境:

数据集:

实验对比:UXCost(截止日期违规率和能耗率的乘积)、参数变化

实验参数:数据集、实验环境

总结

针对实时多模型ML(RTMM)工作负载设计调度器,需要同时考虑多种挑战:异构的ML模型;动态性;数据和控制依赖性;设备计算和能量受限;实时要求。本文提出调度器DREAM,可以有效地处理RTMM系统中实时性、并发性、多模型、多任务的挑战。(1)对于实时性和并发性,提出了MapScore评分指标,同时考虑了紧迫性和公平性。(2)对于级联模型的复杂依赖,跟踪输入帧内和多个帧之间的模型依赖性。(3)对于动态性,开发了具有可调参数的动态调度方法,快速有效地适应工作负载的变化。(4)支持各种基于加速器的ML系统,包括具有异构大小和数据流的多加速器。(5)提出抢先丢帧方法,当预计会违反截止日期时,该方法会提前丢帧,有助于跨帧和模型进行全局优化。(6)超网切换,利用权重共享超网,在重系统负载下动态切换到较轻的模型变体来改进ML系统调度器。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/573736.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大话设计模式之装饰模式

装饰模式(Decorator Pattern)是一种结构型设计模式,它允许向现有对象动态地添加新功能,同时又不改变其结构。装饰模式通过将对象放入包装器中来实现,在包装器中可以动态地添加功能。 在装饰模式中,通常会有…

吉时利KEITHLEY DMM7510数字万用表

181/2461/8938产品概述: Keithley DMM7510 结合了精密数字万用表、图形触摸屏显示器和高速、高分辨率数字转换器的所有优点,创造了业界第一:图形采样万用表。利用 DMM7510 的电压或电流数字化功能,捕获和显示波形和瞬态事件变得更…

【详细讲解PostCSS如何安装和使用】

🌈个人主页:程序员不想敲代码啊🌈 🏆CSDN优质创作者,CSDN实力新星,CSDN博客专家🏆 👍点赞⭐评论⭐收藏 🤝 希望本文对您有所裨益,如有不足之处,欢迎在评论区提…

基于资源的约束委派(中)

烂番茄 基于资源的约束委派通过修改自身msDS-AllowedToActOnBehalfOfOtherIdentity字段达到委派的目的,默认把这台域机器拉入域的域 用户有这个权限,还有谁有?因为evil这台机器通过 07 用户拉入域内,通过AdFind遍历evil的ACL&…

SQL107 将两个 SELECT 语句结合起来(二)(不用union,在where里用or)

select prod_id,quantity from OrderItems where quantity 100 or prod_id like BNBG% order by prod_id;在where子句里使用or

【设计模式】中介者模式的应用

文章目录 1.概述2.中介者模式的适用场景2.1.用户界面事件2.2.分布式架构多模块通信 3.总结 1.概述 中介者模式(Mediator Pattern)是一种行为型设计模式,它用于解决对象间复杂、过度耦合的问题。当多个对象(一般是两个以上的对象&…

自定义你的商店 – 设计WooCommerce商店的新方法

WooCommerce 8.8即将推出,带来了一种无需代码即可创建精美商店的新方法。向“自定义你的商店”问好,这是一项全新功能,将取代“个性化你的商店”入门步骤。 自定义你的商店将利用最新的WordPress站点编辑工具以及酷炫的新Pattern Assembler …

深入浅出:探索Hadoop生态系统的核心组件与技术架构

目录 前言 HDFS Yarn Hive HBase Spark及Spark Streaming 书本与课程推荐 关于作者: 推荐理由: 作者直播推荐: 前言 进入大数据阶段就意味着 进入NoSQL阶段,更多的是面向OLAP场景,即数据仓库、BI应用等。 …

【系统架构师】-第13章-层次式架构设计

层次式体系结构设计是将系统组成一个层次结构,每一层 为上层服务 ,并作为下层客户。 在一些层次系统中,除了一些精心挑选的输出函数外, 内部的层接口只对相邻的层可见 。 连接件通过决定层间如何交互的协议来定义,拓扑…

HelpLook AI ChatBot:自定义Prompts综合指南

AI问答机器人(AI Chatbot)日益在各行业普及,但回答准确率的不足仍是其面临的痛点。用户在与AI问答机器人的互动中常发现,机器人难以完全理解和准确回答复杂问题。HelpLook可以通过自定义提示词(Prompts)和集…

电源电压凹陷是什么?该如何测试电源模块的电压凹陷?

一、电压凹陷 电源电压凹陷是指供电电压有效值在短时间内突然下降到0.1~0.9pu,一般会持续半个周期到几秒钟的时间。一般来说,电压凹陷与电压骤降、电压跌落是同义词,描述的是同一现象。根据电压凹陷持续时间,可分为以下几类&#…

T1 藻类植物 (15分)- 京东前端岗笔试编程题 题解

考试平台: 牛客网 题目类型: 选择题(40分) 3道编程题(60分) 考试时间: 2024-03-23 (两小时) T1 藻类植物 (15分) 题目描述 我们用 x i x_i xi…