FOSS全闪对象存储--与AI/ML相向而行

行业解读·需求剖析

目前,随着AI/ML技术得到了快速的发展及应用,AI/ML系统对底层高速数据访问的需求也日趋强烈,虽然当前业界有多种解决方案,但都存在一些成本或性能方面的挑战,就目前常用的文件存储系统来说,对于小型数据集,这种存储方式或许足够有效,但是一旦数据量激增并伴随着频繁的读写混合操作,文件存储的局限性便变得尤为明显。因此,迫切需要一套面向AI/ML的高性能数据存储服务平台,以应对存储系统日趋强烈的高性能、低成本、接口支持全面的需求。

01   AI/ML面临的数据挑战及问题 

  • AI/ML基础设施昂贵

GPU资源及专用高性能存储等基础设施价格高昂,造成大规模AI/ML计算的成本问题。

  • 海量数据处理/访问低效

AI/ML通常需要海量的数据做支撑,这也要求企业有效地存储、管理及高性能访问大量数据。

  • 模型训练/上线时间长

AI/ML数据访问/服务性能减缓了AI/ML模型训练及模型上线时间,影响企业快速构建部署模型的能力。

02   AI/ML所需的存储架构选型标准 

  • 总体成本

使用较低成本构建面向AI/ML计算任务的高性能数据访问平台。

  • 性能及协议支持

提供高性能数据访问接口,多数据访问协议兼容(POSIX,S3等)。

  • 数据格式及架构开放

支持透明数据格式(保持原始存储目录和文件格式不变); 无厂商/技术锁定。

  • 智能数据管理/运维

降低数据管理成本,减少数据运维对训练流程/效率影响(最少数据迁移时间、故障预判、磁盘健康管理、减少运维等)。

  • 信创生态支持/自主可控

全自主的国产化分布式全闪存储软件,具备完全自主知识产权。

国内首款·性能出众

01  针对高性能硬件设计

FOSS对象存储是国内首款面向高性能全闪存硬件的对象存储系统。这意味着它充分利用了高性能硬件的特性,为用户提供了更快的数据访问速度。同时,在冷热数据分层和大比例EC的技术加持下,即提供了高性能读写,又保证了存储可用容量,降低使用成本。

图片

图片

02  高效的智能分层技术

为确保在线数据的卓越性能和低延迟,同时满足离线数据的大规模存储和成本控制需求,FOSS产品设计了创新的分层功能。

第一级缓存——内存缓存,这一关键组件负责迅速响应写请求,显著提升整体性能。通过先进的合并刷盘技术,它能将离散的、随机的小块IO高效地合并为连续的大块IO,再顺序写入到下层存储介质中。这种技术不仅大幅提高系统IOPS,而且智能地聚合写请求,有效减少了HDD硬盘的寻道次数,降低了硬盘的损耗,还延长了硬盘的使用寿命。

第二级缓存——闪存缓存,不仅加速了数据的读写速度,而且利用其独特的保电特性,确保新写入数据在闪存盘上的即时存储即可视为数据安全的标志。这意味着一旦数据成功写入闪存盘,客户端会立即收到写操作成功的反馈,无需等待数据进一步写入硬盘。

这套先进的存储系统采纳了两级缓存技术,显著提升了数据存储和访问的效率。

图片

03  多样化协议支持

提供高性能数据访问接口,兼容多种访问协议(S3,POSIX,NFS等)。AI应用场景通常涉及数据处理的多协议和长链路,并且往往是混合负载交织在一起,存在多个数据集之间来回拷贝,这样不仅数据处理效率低下,性能也无法满足AI应用的使用需求,因此协议的融合兼容,可以免去大量的数据复制,让数据处理的效率大幅提升。

图片

04  易于管理和维护

FOSS对象存储具有简洁明了的管理界面、多维度的系统健康状态监控、智能的链路慢查询及磁盘健康监测等,降低了产品使用门槛,无需在多个管理平台反复切换,使得管理员能够更轻松地管理和维护存储系统。

图片

05  绿色低碳与高性能

AI/ML应用场景驱动了电力需求呈几何级数增长, 而FOSS对象存储恰以超大规模数据长期、可靠、绿色低碳、高性能存取为目标。它特别注重在提供高性能的同时,降低能源消耗,符合当前绿色节能的发展趋势,可以依据业务访问需求,智能调度集群,动态选取提供数据访问的Disk,将其他未调度的Disk置于低功耗状态(单片SSD<0.5w),降低集群功耗,降低数据中心PUE。

图片

06  信创生态,自主可控

2019年加入信息技术应用创新工作委员会,加入存储、云计算、整机等多个工作组,多款产品入选工委会产品图谱目录,全面认证国产化CPU、操作系统、云计算等平台,2022年先后加入重庆、成都、广州信创联盟,积极推动国产自主创新

图片

全闪助力·收益倍增

  • 提升存储性能

图片

FOSS全闪对象存储采用了闪存技术,提供了比传统开源对象存储minio/ceph更高的读写速度和更低的延迟。这使得AI/ML模型训练过程中的数据访问速度得到大幅提升,从而加快训练速度,缩短训练周期。

  • 扩大存储容量

图片

FOSS对象存储具有优秀的横向扩展能力,可以轻松应对AI/ML行业对存储容量的巨大需求。随着AI/ML模型的不断发展和优化,所需的数据量也在不断增加,而全闪对象存储可以轻松地通过增加节点来扩展存储容量,满足AI/ML行业的存储需求。

  • 降低存储成本

传统的存储方式在面对大量非结构化数据时,其成本和管理复杂性会显著增加。而FOSS对象存储的设计就是为了应对这种需求,它使得存储成本得以降低,同时简化了管理和使用的复杂性。

  • 保护数据安全

由于AI/ML数据可能包含敏感信息(如用户数据、商业机密等),因此存储特性的系统必须具有高安全性。FOSS全闪对象存储支持数据加密、访问控制、多版本等功能,多维度保护用户数据的高安全性。

图片

  • 保障数据可靠

AI/ML模型训练依赖于大量数据,一旦数据丢失或损坏,将造成不可估量的损失。FOSS全闪对象存储提供了多种安全措施,如故障域、文件复制、远程复制等,帮助在原始数据受损或丢失时恢复数据,确保数据的准确性和完整性。

  • 优化数据处理

AI/ML大模型训练需要处理大量的数据,而FOSS全闪对象存储通过并行文件系统提供了更高的性能和更多的容量空间,能够加快数据的处理速度,大幅提升大模型训练效率。

未来可期

综上所述,FOSS全闪对象存储的性能提升能够为AI/ML行业带来了巨大的收益,不仅能够提高AI/ML模型训练的效率和速度,还能降低了存储成本,优化数据处理,并保障数据安全。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/702850.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PDF编辑阅读器PDF Expert for Mac v3.10.1中文激活版

PDF Expert for Mac是一款易于使用的 PDF 编辑器和注释器&#xff0c;专为 Mac 设备设计。它允许用户轻松查看、编辑、签名、注释和共享 PDF。该软件使用户能够向他们的 PDF 添加文本、图像、链接和形状&#xff0c;突出显示和标记文本&#xff0c;填写表格以及签署数字文档。它…

java聊天室项目小结

实现了群管理&#xff0c;发起群聊功能&#xff0c;可以解散群&#xff0c;退出群里&#xff0c;群主修改群基本信息&#xff0c;邀请好友进群功能 邀请好友&#xff0c;只会显示没被邀请的好友 今天完成申请入群&#xff0c;群踢人&#xff0c;设置管理员等操作

软考-下午题-试题一

1、概念 2、答题技巧和规范 问题1、2&#xff1a;直接看 格式&#xff1a; 问题3&#xff1a; 格式&#xff1a; 3、例题 eg2&#xff1a;可以以后写完问题4之后&#xff0c;把问题3补充完整 问题4&#xff1a; 问题4 官方解释&#xff1a; 问题4&#xff08;3‘&#xff09; 2…

批量下载huggingface的仓库全部权重文件

下载huggingface的仓库全部权重文件 配置和下载git-lfs **ubuntu:**sudo apt-get install git-lfs 其他&#xff1a; 下载git-lfs Releases git-lfs/git-lfs (github.com) 配置&#xff1a; export PATH$PATH://home/software/lfs/git-lfs-3.5.1/ # 其中目录为你文件夹的目…

【软件的安装与基本设置】AD21软件的PCB规则设置

在绘制PCB之前&#xff0c;要进行规则的创建&#xff0c;因为在绘制PCB的过程中&#xff0c;难免会出现很多错误&#xff0c;所以需要先对绘制PCB创建规则&#xff0c;即所有的打孔&#xff0c;走线&#xff0c;铺铜都要基于电气性能规则去设计&#xff0c;等到后期&#xff0c…

LeetCode算法题:49. 字母异位词分组(Java)

给你一个字符串数组&#xff0c;请你将 字母异位词 组合在一起。可以按任意顺序返回结果列表。 字母异位词 是由重新排列源单词的所有字母得到的一个新单词。 示例 1: 输入: strs ["eat", "tea", "tan", "ate", "nat", …

(001)apidoc 的安装

安装 1.确定 node 和 npm 的匹配版本 node -vv10.14.1# 切换node 版本 nvm list nvm use 20.12.22.安装 apidoc。 npm install -g apidoc3.生成文档&#xff1a; apidoc -i ../ -o document/ -f ".java$"-i &#xff1a;指定扫描路径。-o&#xff1a;输出目录。…

AIGC——Instant-Style文本到图像生成中的样式保留算法解析

0.概述 在过去的几年中&#xff0c;基于调整的扩散模型在广泛的图像个性化和定制任务中取得了显着的进展。然而&#xff0c;尽管有潜力&#xff0c;当前基于调整的扩散模型在生成和生成风格一致的图像方面仍然面临着一系列复杂的挑战&#xff0c;其背后可能有三个原因。首先&a…

ELF 1技术贴|如何在Ubuntu上配置Samba服务器

Samba是一个开源的软件套件&#xff0c;提供了一种实现SMB/CIFS协议的方式&#xff0c;可以无缝链接Linux与Windows系统&#xff0c;让开发者在局域网络框架下实现共享文件、打印资源等&#xff0c;确保了数据交流的高效与稳定。 相较于在Ubuntu环境下运用传统的Vim编辑器&…

Ubuntu20.04调试功能包的一些报错解决办法【更新中2024.05.14】

一、Could not find a package configuration file provided by “catkin_virtualenv” 解决办法&#xff1a; sudo apt install ros-noetic-catkin-virtualenv二、 ERROR: Could not find a version that satisfies the requirement pip-tools5.1.2 (from versions: none) …

No Cortex-M SW Device Found

将DIO和CLK管脚调换一下

仿C#或Java基础类型自定义

class Int{ private:int _value 0; public:operator int() const{ // 隐式转换return _value;}// 显式转换explicit operator int*() const { return nullptr; }operator(const int page){_value page;}operator float() const{return static_cast<float>(_value);}ope…