【论文阅读——SplitFed: When Federated Learning Meets Split Learning】

级别CCFA

1.摘要

联邦学习(FL)和分割学习(SL)是两种流行的分布式机器学习方法。两者都采用了模型对数据的场景;客户端在不共享原始数据的情况下训练和测试机器学习模型。由于机器学习模型的架构在客户端和服务器之间分割,SL提供了比FL更好的模型隐私性。此外,分割模型使SL成为资源受限环境的更好选择。然而,由于在多个客户端之间基于中继进行训练,SL的速度比FL慢。

2.贡献

本文提出了一种名为分割联邦学习(SFL)的新方法,它将这两种方法融合在一起,消除了它们固有的缺点,并采用了一种精细的架构配置,结合差分隐私和PixelDP来增强数据隐私和模型鲁棒性。我们的分析和实证结果表明,(纯)SFL在多个客户端上比SL显著减少了每个全局时期的计算时间,同时提供了类似的测试精度和通信效率。此外,就像SL一样,它在客户端数量增加时的通信效率优于FL。此外,带有隐私和鲁棒性措施的SFL在扩展实验设置下进一步进行了评估

3.目标场景

FL的主要优势在于它允许跨多个客户端并行进行高效的ML模型训练。在FL中,客户端的计算需求和ML训练期间的模型隐私是两个主要问题。(对于一些商业公司的模型,肯定是不能全部下发导数据提供方进行训练的,同时对于客户端服务器配置的要求也比较高)
在SL中,通过切割模型可以使数据公司无法拥有全部模型,同时降低了对于数据公司设备的要求。但SL中的中继式训练会导致客户端资源处于空闲状态,因为一次只有一个客户端与服务器交互;这会导致在许多客户端下训练开销的显著增加。

4.方法

4.1 方法概览

在这里插入图片描述
我们假设模型分为特征提取部分 M c M_c Mc和结果推理部分 M t M_t Mt
这里主要存在3个部分:

  • Client
    • 数据的提供方,将数据通过 M c M_c Mc得到smashed data发送给主服务器。
    • 需要等待服务器进行反向传播,更新本地的 M c M_c Mc
    • 并将 M c ′ M_c' Mc上传到聚合FedServer
    • 等待从FedServer上接收平均后的 M c f e d M_{c}^{fed} Mcfed
    • 用接收后的 M c M_c Mc来提取数据特征
  • Main Server
    • 负责模型的推理和反向传播
  • FedServer
    • 负责 M c M_c Mc的接收、平均和下发

4.2 SFL的几种变体

  • 基于服务器端聚合
    • SFLV1
      • MainServer模型中存在聚合特征部分
    • SFLV2
      • 删除MainServer模型聚合特征部分来增加模型准确性的可能性
  • 基于数据标签分享
    • 将数据标签共享到服务器
      • 基于MPC等技术
    • 不共享任何数据标签到服务器
      • SFL中的ML模型可以被划分为三个部分,假设是一个简单的设置。每个客户端将处理两个客户端模型部分;一个是W的前几层,另一个是W的最后几层和损失计算。W的剩余中间层将在服务器端计算。

6.反思

感觉这个方法真的很酷,但是工程上存在着网络等多种复杂情况。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/619700.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

高中数学:三角函数-4个解题妙招

一、对偶式 1、针对题型 同角三角函数的问题 2、方法定义 对于形如下方的式子,就可以用对偶式方法解 3、练习 例题1 例题2 二、巧用三角函数定义 1、针对题型 没有给出具体三角函数值的问题 2、方法定义 3、练习 例题1 三、诱导公式 1、针对题型 锐…

深圳比创达电子EMC|什么是人体静电

当人体与衣物或其他物体发生相互摩擦时,由于各种材料对电子的束缚能力不同,导致电子从一种物质转移到另一种物质。这种电子的转移现象使得人体带上了静电。 如果我们无法及时有效地释放身上积聚的电荷,静电就会在人体表面积聚。这通常发生在…

基于 Operator 部署 Prometheus 监控 k8s 集群

目录 一、环境准备 1.1 选择版本 1.2 过滤镜像 1.3 修改 yaml 镜像 1.4 移动 *networkPolicy*.yaml 1.5 修改 service 文件 1.6 提前下载镜像并推送到私有镜像仓库 1.7 修改镜像(可选) 二、执行创建 三、查看 pod 状态 四、访问 prometheus、…

视频编辑软件pitivi基本功之安装篇

视频编辑软件pitivi基本功之安装篇 台式机的系统是openSUSE-Leap-15.5-DVD-x86_64 应用程序——工具——终端,切换到root用户 ruhonglocalhost:~> su - 密码: localhost:~ # zypper search pitivi localhost:~ # zypper install pitivi ruhonglocalho…

Python爬虫-京东商品评论数据

前言 本文是该专栏的第68篇,后面会持续分享python爬虫干货知识,记得关注。 在本专栏之前,笔者有详细介绍京东滑块验证码的解决方法,感兴趣的同学,可以直接翻阅文章《Python如何解决“京东滑块验证码”(5)》进行查看。 而本文,笔者以京东商品详情页的评论数据为例,通过…

第一节:什么是操作系统

什么是操作系统 一、一台计算机的组成部分1、计算机能干啥2、谈谈计算机硬件 二、什么是操作系统三、学习操作系统的层次 一、一台计算机的组成部分 如下图所示: 这就是就是构成一台计算机的组成部分 1、计算机能干啥 ∙ \bullet ∙计算机是我们专业吃饭的家伙&a…

有什么好用的财务记账软件?

易舟云财务软件是一款功能强大且易于使用的财务记账软件,适用于个人和小型企业。它提供了一系列财务管理工具,包括收支记录、会计凭证、资产负债表和利润表等。用户可以轻松录入和管理日常收支,生成详细的财务报表,帮助用户更好地…

一款免费、开源、可批量识别的离线OCR软件,适用于 Windows7 x64及以上平台

免费:本项目所有代码开源,完全免费。方便:解压即用,离线运行,无需网络。高效:自带高效率的离线OCR引擎,内置多种语言识别库。灵活:支持命令行、HTTP接口等外部调用方式。功能&#x…

神经网络模型底层原理与实现8-BERT

首先介绍什么是自监督学习: 普通的有监督学习是每个x对应有个y,x训练得到y,将y与y作比较,而自监督是没有对应y,直接把一部分样本x作为训练目标x,训练得x后和x对比 bert中如何创造x:以文字处理为…

【备战测开】—— 编程语言Python(二)

续上上篇的讲解:【备战测开】—— 编程语言Python(一) 6 面向对象编程 所谓的面向对象其实就是把属性和方法封装起来,以供重复调用 6.1 类和对象 参考博客:python类和对象最全详解(持续修订中&#xff…

vue3 动态class和style

1、需求:一个删除的弹窗,点击会提示“是否需要删除XXXXX(name)”,但是name不固定,所以删除弹窗的width不能写死。(如果不设置width,本项目的弹窗会自适应变得特别长)

最新版守约者二级域名分发系统

主要功能 二级域名管理: 我们的系统提供全面的二级域名管理服务,让您轻松管理和配置二级域名。 域名分发:利用我们先进的域名分发技术,您可以自动化地分配和管理域名,确保每个用户或客户都能及时获得所需的域名资源。…