Fluid 1.0 版发布,打通云原生高效数据使用的“最后一公里”

作者:顾荣

前言

得益于云原生技术在资源成本集约、部署运维便捷、算力弹性灵活方面的优势,越来越多企业和开发者将数据密集型应用,特别是 AI 和大数据领域应用,运行于云原生环境中。然而,云原生计算与存储分离架构虽然带来了资源经济性与扩容灵活性方面的优势,但也引入了数据访问延迟高、带宽开销大等方面的使用问题。

在数据访问接口层面,Kubernetes 只提供了传统数据访问接入层面的接口,即异构存储服务接入和管理标准接口(CSI,Container Storage Interface),对应用如何在容器集群中高效使用和灵活管理数据并没有定义。然而,这是很多数据密集型应用依赖这样的高层数据访问和管理接口,例如:在运行 AI 模型训练任务时,数据科学家需要能够管理数据集版本、控制访问权限、数据集预处理、动态数据源更新、加速异构数据读取等。但是,在 Fluid 开源项目诞生之前,Kubernetes 开源生态社区中还没有这样的标准方案,这是云原生环境拥抱大数据与 AI 应用的一块重要拼图。

为了应对这些挑战,由来自学术界的南京大学,工业界的阿里云团队和 Alluxio 开源社区共同发起了 Fluid 开源项目,通过对“计算任务使用数据的过程”进行抽象,提出了云原生弹性数据抽象概念(如:DataSet),并作为“一等公民”在 Kubernetes 中实现。围绕弹性数据集 Dataset,我们创建了云原生数据编排与加速系统 Fluid,来实现 Dataset 管理(CRUD 操作)、权限控制和访问加速等能力。在 2021 年 4 月份进入云原生计算基金会(CNCF)之后,经过 36 个月的不断研发迭代和生产环境验证,现在正式发布了其成熟稳定的 v1.0 大版本。

Fluid 开源项目网站:
https://fluid-cloudnative.github.io/

Fluid 项目 Github 开源 repo:
https://github.com/fluid-cloudnative/fluid

开源驱动发展,生产环境验证

Fluid 的测试体系涵盖了每日进行的单元测试、功能测试、兼容性测试、安全测试以及实际应用场景测试。每次版本发布前,Fluid 会在不同的 Kubernetes 版本中进行兼容性测试。

Fluid 技术源自校企科研合作,项目正式开源后,吸引了来自不同行业,不同规模的社区用户将 Fluid 应用到更广泛的场景中:AIGC,大模型,大数据,混合云,云上开发机管理,自动驾驶数据仿真等。Fluid 在支撑云上真实应用中不断迭代改进,并应用到生产环境中,系统的稳定性,性能和规模也变得成熟。

据公有云和私有云环境的统计,目前已有上千个 Kubernetes 集群在持续使用 Fluid,其中在用户机器学习平台可以支持最大上万节点规模。每天在云原生环境中创建 Fluid 的用户主要来自互联网、科技、金融、电信、教育、自动驾驶与机器人、智能制造等领域。Fluid 开源社区用户包括有小米、阿里巴巴集团、阿里云 PAI 机器学习平台、中国电信、微博、B 站、360、乾象、作业帮、赢彻、虎牙、Oppo、云知声、云刻行、深势科技等。更多使用信息请查看注册用户列表。

部分用户也在 Fluid 开源社区分享了他们在不同场景的实践:

  • 小米机器学习平台:基于 Fluid 的高效 Serverless 混合云容器 AI 平台 [ 1]
  • 从资源弹性到数据弹性,乾象如何将云上量化研究效率提升 40%?
  • 深势科技基于 Serverless 容器为科研人员打造高效的开发平台
  • 阿里集团基于 Fluid+JindoCache 加速大模型训练的实践
  • 作业帮检索服务基于 Fluid 的计算存储分离实践 [ 2]

Fluid 1.0 新增核心功能速览

Fluid v1.0 的发布,带来了以下几项核心功能:

1. 可灵活配置的多级数据亲和性调度机制

Fluid 的多级数据亲和性调度能力允许用户根据数据集缓存的位置信息对任务进行调度,而无需深入了解底层数据缓存的具体排布。Fluid 通过以下方式实现这一调度策略:

a. 数据缓存本地性级别: Fluid 根据数据缓存的本地性,即数据与计算任务的距离,将数据访问划分为不同的级别。这可能包括同一个节点(Node)、机架(Rack)、可用区(Availability Zone)、区域(Region)等不同级别。

b. 优先调度策略: Fluid 优先将计算任务调度到数据缓存所在的节点,实现最佳的数据本地性。如果无法实现最佳本地性,Fluid 会根据数据的传输距离,将任务调度到不同级别的节点上。

c. 灵活配置性: 考虑到不同云服务提供商和对亲和性定义的各不相同,Fluid 支持基于 label 进行自定义配置。用户可以根据具体的云环境和集群配置,调整调度策略,以适应不同的需求。

功能详见:Fluid 支持分层数据缓存本地性调度(Tiered Locality Scheduling) [ 3]

2. 增加自定义数据操作 DataProcess 和触发策略的丰富

Fluid 负责在 Kubernetes 中编排数据和使用数据的计算任务,不仅包括上文提到的空间上的编排,也包括时间上的编排。空间上的编排意味着计算任务会优先调度到有缓存数据和临近缓存的节点上,这样能够提升数据密集型应用的性能。而时间上的编排则允许同时提交数据操作和任务,但在任务执行之前,要进行一些数据迁移和预热操作,以确保任务在无人值守的情况下顺利运行,提升工程效率。

为此,在最新版本的 Fluid 里提供一种新的数据操作类型 DataProcess,为数据科学家提供自定义数据处理逻辑的抽象;并且在此基础针对所有的 Fluid 数据操作提供不同的触发机制,包括:once, onEvent, Cron。

以下例子为每 2 分钟运行一次数据预热。

apiVersion: data.fluid.io/v1alpha1
kind: DataLoad
metadata:name: cron-dataload
spec:dataset:name: demonamespace: defaultpolicy: Cronschedule: "*/2 * * * *" # Run every 2 min

3. 数据流 DataFlow

进一步地,Fluid 提供 DataFlow 数据流功能,允许用户通过 Fluid 提供的 API 定义自动化的数据处理流程:DataFlow 支持 Fluid 的全部数据操作,包括缓存预热(DataLoad),数据迁移(DataMigrate),数据备份(DataBackup)等面向运维侧人员的自动化数据操作和面向数据科学家的数据处理(DataProcess)相结合,实现简单的数据操作。

以该图为例,整个的顺序是:

a. 将需要消费的数据从云上低速存储(例如:OSS、HDFS)迁移到高速存储(例如:JuiceFS,GPFS)

b. 启动 AI 模型训练

c. AI 模型训练完成后将数据迁移回低速存储

注:DataFlow 数据流仅支持串联多个数据操作,根据定义的先后顺序一个一个执行。不支持多步骤并行执行、循环执行、按条件选择性执行等高级语义, 如果用户有明确此类需求,推荐使用 Argo Workflow 或者 Tekton。

4. 通过 Python SDK 使用 Fluid

在实践中,我们发现数据科学家更倾向于应该用代码(Python)而不是 YAML 来定义。为此 Fluid 提供更高层次的 Python 接口来简化数据集的自动化操作和数据流的编写,下面是上面流程的 Python 实现:

flow = dataset.migrate(path="/data/", \migrate_direction=constants.DATA_MIGRATE_DIRECTION_FROM) \.load("/data/1.txt") \.process(processor=create_processor(train)) \.migrate(path="/data/", \migrate_direction=constants.DATA_MIGRATE_DIRECTION_TO) run = flow.run()

样例详见以下链接:https://github.com/fluid-cloudnative/fluid-client-python/blob/master/examples/02_ml_train_pipeline/pipeline.ipynb

5. 新增 Vineyard 对象缓存引擎支持

Fluid 支持以插件的方式接入分布式缓存,目前已经支持 Alluixo, JindoFS, JuiceFS 等针对文件系统的分布式缓存引擎。在 Fluid 1.0 版本接入了分布式内存数据管理引擎 Vineyard,结合了 Vineyard 的高效数据共享机制和 Fluid 的数据任务编排能力,为数据科学家提供了以 Python 作为操作接口的方式,让他们能以熟悉的方式高效地进行 Kubernetes 上的中间数据管理。

更多细节请查看:Fluid 携手 Vineyard,打造 Kubernetes 上的高效中间数据管理

6. 更多其他更新

在生产环境使用开源软件,稳定,规模和安全一直是重中之重。因此这也是 Fluid 持续关注和加强的领域。

a. 服务于大规模 Kubernetes 场景

在大规模的 Kubernetes 生产环境中,Fluid 的性能和扩展性已得到了很好验证。在真实的用户环境中,Fluid 能够稳定地支持有超过一万个节点的集群。在每天 24 小时的运行周期内,Fluid 负责处理超过 2500 个数据集的全生命周期管理和超过 6000 个通过 Fluid 挂载数据集访问数据的 AI 工作负载(总共约有 12 万个 Pods)。

考虑到 Fluid 已被广泛地部署在几个大规模的生产级 Kubernetes 集群中,我们对 Fluid 的控制平面组件进行了压力测试。测试结果显示,Fluid 的 Webhook 在 3 个副本的情况下能够以每秒 125 个请求(QPS)的速度处理 Pods 的调度请求,而 Webhook 处理请求的 90% 的延迟少于 25 毫秒。针对于 Fluid 的控制器,测试结果表明,每分钟能支持配置 500 个 Fluid 数据集以上的自定义资源。以上结果充分证明了 Fluid 可以满足规模化集群的使用场景。

b. FUSE 挂载点自动恢复增强的生产可用

在大规模的模型训练和推理任务场景下,FUSE 进程可能因为内存资源不足以及其他原因崩溃重启,造成业务容器内 FUSE 挂载点断联,出现数据访问异常并影响在线业务可用性。基于 FUSE 的存储客户端更容易发生这样的问题,一旦这些问题无法自动修复,则可能中断任务和服务,同时人工修复的复杂度和工作量也是巨大的。针对此问题,Fluid 1.0 优化了自恢复机制,并且已经在多个规模化用户场景下上线。

c. 收敛 Fluid 组件的安全权限

在 1.0 版本中,为了实践“权限最小化”的原则,Fluid 移除了不必要的 RBAC 资源访问和权限。

更多的更新可以查看:https://github.com/fluid-cloudnative/fluid/releases/tag/v1.0.0

后续版本规划

帮助 AI/大数据的用户在 Kubernetes 中更加高效、灵活、经济、安全地使用数据,这是 Fluid 开源项目的目标和愿景:

在 1.0 版本,Fluid 进一步打破了数据和计算的壁垒,实现了用户可以从异构 Kubernetes 环境(包括 runC 和 KataContainer)灵活使用异构数据源(对象存储,传统分布式存储,可编程的内存对象), 同时通过 Alluxio,JuiceFS,JindoFS,Vineyard 等多种分布式缓存引擎和数据亲和性调度提升应用访问数据的效率。

在未来版本中, Fluid 会继续与 Kubernetes 云原生生态紧密结合,同时更加关注数据科学家的效率和体验,我们计划专注解决以下问题:

  1. 针对大模型推理场景的优化,面向多种场景提升大模型加载效率。

  2. 与 Kubernetes 调度器相结合,自适应地实现根据 Kubernetes 调度器的调度结果,选择合适的数据访问方式(CSI 模式和 sidecar 模式的自动识别)。

  3. 除了面向运行环境,支持数据科学家在使用开发环境中更灵活地使用 Fluid,例如:解决数据源变更带来的容器重新启动,易造成临时数据丢失方面的问题。

致谢

我们感谢所有为 Fluid 1.0 版本发布付出努力的开源项目贡献者!详细贡献内容和贡献者信息请参见 Fluid 开源项目 1.0 版本 release note:https://github.com/fluid-cloudnative/fluid/releases/tag/v1.0.0

我们感谢 Fluid 开源社区用户给与的开源项目验证反馈和支持!Fluid 开源社区用户公开信息登记列表请参见:https://github.com/fluid-cloudnative/fluid/blob/master/ADOPTERS.md

参考链接:

[1] 小米机器学习平台:基于 Fluid 的高效 Serverless 混合云容器 AI 平台

https://www.infoq.cn/article/kco7hi5TcVE08ySwNIw7

[2] 作业帮检索服务基于 Fluid 的计算存储分离实践

https://www.infoq.cn/article/W65RcTI8AUhmoHVLkzWo?utm_source=tuicool&utm_medium=referral

[3] Fluid 支持分层数据缓存本地性调度(Tiered Locality Scheduling)

https://developer.aliyun.com/article/1382880

点击此处,查看 Fluid 1.0 Release Note!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/724359.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

springboot Invalid bound statement (not found): com.elitel.xxx.dao.xxx 错误处理

如果这篇文章能给你带来帮助,不胜荣幸,如果有错误也请批评指正,一起学习,共同进步!今天给同事看了个问题,发现了这个问题,之前也遇见过,可是没有遇见这种情况,这次我记录一下。首先来说,造成这个错误的原因是什么。它是在Spring Boot应用程序中遇到“Invalid bound s…

yrx24题万籁俱寂

fiddler抓包会被检测,可以用Charles抓包。 用的http2.0协议,不能用request请求,可以用httpx来请求拿到数据

利用cloudflare workers解决docker无法拉取镜像问题

由于某些原因,目前国内无法正常拉取docker镜像,很多以前的加速网站也都无法使用了 虽然阿里的个人专属镜像加速还能用,但是已经大不如以前了,很多时候都会报错超时,所以,需要另寻它途 而cloudflare workers则可以非常完美的解决这个需求 准备一个自己的域名cloudflare账号…

多款可观测产品全面升级丨阿里云云原生 5 月产品月报

《阿里云云原生每月动态》,从趋势热点、产品新功能、服务客户、开源与开发者动态等方面,为企业提供数字化的路径与指南。云原生月度动态 云原生是企业数字创新的最短路径。 《阿里云云原生每月动态》,从趋势热点、产品新功能、服务客户、开源与开发者动态等方面,为企业提供…

序列化-serialVersionUID作用

Serializable接口 作用:标记一个类可以被序列化,如果没有实现该接口,则会抛出异常。 ObjectOutputStream中源码:实验:serialVersionUID 作用:表示一个序列换版本,控制序列化与反序列化。 实现Serializable接口后,如果不显式设置serialVersionUID,那么系统会根据类中内…

【运维技巧】海豚调度工作流实例卡在正在停止任务实例卡在正在运行怎么办?

在大数据调度系统中,,大家可能会碰到任务实例状态更新不及时的情况。 对于Apache DolphinScheduler用户来说,这可能意味着前端显示的任务状态与实际情况不一致,即使任务已经在后台停止运行,前端仍显示为“正在运行”。这种现象不仅影响监控和管理,还可能导致后续任务调度…

想做物联网卡系统 是因为不想忍

(点击图片 查看 首年进度条)无论是否成功我们将持续投入最低三年持续资源研发开发开源IoTOS-物联网卡 这个体系的软件功能;期初做物联网卡软件仅仅是上班混口饭吃随着公司与发展看到了痛点及真实用户需求有了自身的想法想来做一套已 为使用者 ‘盈利’ 为目的 的物联网卡软件…

用于NLP的Python:使用Keras的多标签文本LSTM神经网络分类|附代码数据

全文下载链接:http://tecdat.cn/?p=8640 在本文中,我们将看到如何开发具有多个输出的文本分类模型。我们开发一个文本分类模型,该模型可分析文本注释并预测与该注释关联的多个标签。多标签分类问题实际上是多个输出模型的子集。在本文结尾,您将能够对数据执行多标签文本分…

微服务架构qiankun集成react子应用

前一篇文章讲了qiankun集成vue子应用,这篇随笔讲集成react子应用。 1、创建react子应用 用react脚手架初始化一个react项目,至于项目的数据仓库store和路由、以及UI组件库这里就不做讲解,可以自己自行网上找资料配置。create-react-app my-react-app2、在src路径下创建publ…

MyBatis 的在使用上的注意事项及其辨析

1. MyBatis 的在使用上的注意事项及其辨析 @目录1. MyBatis 的在使用上的注意事项及其辨析2. 准备工作3. #{ } 与 ${ } 的区别和使用{}3.1 什么情况下必须使用 $3.1.1 拼接表名3.1.2 批量删除3.1.3 模糊查询3.1.3.1 使用 ${ }的方式3.1.3.2 使用 #{ } 的方式4. typeAliases 别名…

IBM服务器阵列卡损坏恢复案例

一台IBM服务器,型号是7944IBM的3550M3的服务器差不多有10年左右,有4块1TB的SAS硬盘,开机面板有报错,系统进不了,是一台金蝶K3的就是ERP的财务服务器资料相当重要,客户的需求是希望就是数据不丢的前提下,把系统启动起来,给它修复。好在实际检测了硬件后发现,是阵列卡损…

2轮DES差分分析

一、差分分析上图是2轮DES的框架图。是已知的,试图找出B和C的差分值:同样,为了计算方便,将L0等于L0*,那么,差分值就变成:二、代码实现 如果大家对代码实现感兴趣的话,可以根据2轮DES差分分析原理,对1轮差分分析代码做出调整,完成2轮差分分析代码实现。这里把2轮DES差…