云原生周刊:云原生和 AI

news/2025/2/24 17:18:54/文章来源:https://www.cnblogs.com/kubesphere/p/18734511

开源项目推荐

FlashMLA

DeepSeek 于北京时间 2025 年 2 月 24 日上午 9 点正式开源了 FlashMLA 项目。FlashMLA 是专为 NVIDIA Hopper 架构 GPU(如 H100、H800)优化的高效多头潜在注意力(MLA)解码内核,旨在提升大模型推理性能,特别是针对可变长度序列进行了优化。
性能表现:

在 NVIDIA H800 SXM5 GPU 上,FlashMLA 展现了卓越的性能:

  • 内存带宽: 高达 3000 GB/s,确保快速的数据传输和访问。
  • 计算性能: 峰值达到 580 TFLOPS,满足大规模 AI 任务的计算需求。

DeepLearningExamples

NVIDIA 的开源项目 DeepLearningExamples 提供了最先进的深度学习模型实现,涵盖计算机视觉、自然语言处理、推荐系统等领域。这些示例经过优化,可在 NVIDIA GPU 上实现最佳性能和精度,支持多种深度学习框架,如 PyTorch、TensorFlow 和 PaddlePaddle。此外,项目集成了最新的 NVIDIA CUDA-X 软件栈,确保在 Volta、Turing 和 Ampere 架构的 GPU 上高效运行。开发者可以利用这些资源,快速训练和部署模型,加速 AI 研究与应用。

LoxiLB

LoxiLB 是一个开源的云原生负载均衡器,专为 Kubernetes、边缘计算、5G、物联网等场景设计。它采用 eBPF 作为核心引擎,使用 Go 语言编写,提供高性能、灵活且可编程的负载均衡服务。LoxiLB 支持多种模式,包括 NAT44、NAT66、NAT64、FullNAT 和 DSR 等,具备高可用性和高扩展性。此外,它还支持 L7 代理、SRv6 实现以及 GTP 隧道等特性,能够自动化管理外部负载均衡器的部署、配置、扩展和监控等任务。LoxiLB 旨在为云原生环境中的网络负载均衡提供高效、灵活的解决方案。

Cube Studio

Cube Studio 是由腾讯音乐开源的云原生一站式人工智能平台,涵盖机器学习、深度学习和大模型开发等全流程。该平台提供从数据管理、模型开发、训练到部署的完整解决方案,支持多种功能模块,如在线开发、任务编排、分布式训练、超参数搜索、推理服务、边缘计算、标注平台和大模型微调等。Cube Studio 采用模块化设计,用户可根据需求灵活组合各功能模块,快速构建适合自身业务的 AI 平台。

文章推荐

云原生 AI:引领企业 IT 变革的双引擎

本文探讨了云原生技术与人工智能(AI)如何共同推动企业 IT 能力的发展。作者 Ken Kaplan 指出,随着生成式 AI、AI 增强和云原生技术在 Gartner 2023 年新兴技术炒作周期中达到预期膨胀的顶峰,这些技术正日益融合,成为企业未来发展的关键驱动力。Kaplan 强调,尽管一些组织仍在探索如何利用这些技术,许多企业已积极推进,将云原生和 AI 视为提升业务效率和生产力的核心手段。他还提到,K8s 等云原生平台的成熟,使得容器编排更为普及,为 AI 应用的开发和管理提供了灵活性和可扩展性。

探索 k8gb 的多集群容错机制

作者 Gerardo Lopez 介绍了 k8gb,这是一种为跨多个 Kubernetes 集群运行的应用程序提供全局负载均衡的解决方案。k8gb 通过实时健康检查确保流量被引导至健康的集群,并与外部 DNS 提供商集成,以管理故障转移场景。该工具支持多种部署策略,包括主动-主动和主动-被动模式,使组织能够自信地在地理上分布的集群中运行应用程序,确保最佳性能和最小的停机时间。

福布斯:从云原生到 AI 原生的演进

本文探讨了企业在数字化转型过程中,从云原生架构迈向 AI 原生模式的必要性和实施路径。云原生技术通过微服务和容器化提升了系统的灵活性和可扩展性,而 AI 原生模式则将人工智能深度融入业务流程,实现自动化和智能化决策。这一转变需要企业在数据管理、模型训练和 AI 工具集成方面进行战略性投资,同时培养具备 AI 技能的人才,以确保成功实施和持续优化 AI 驱动的解决方案。

然而,迈向 AI 原生并非易事,企业必须克服数据隐私、伦理问题和技术复杂性等挑战。制定明确的 AI 战略、建立跨部门协作机制,以及持续监测和评估 AI 系统的表现,对于实现 AI 原生至关重要。通过稳健的规划和执行,企业能够在 AI 时代保持竞争优势,推动创新和业务增长。

云原生动态

Podman Desktop 1.16 发布

Podman Desktop 1.16 正式发布了,带来了多项新功能和改进:

  • 实验性功能:在设置中新增“实验性”板块,用户可查看当前的实验功能列表,并链接至相关讨论页面。

  • 状态栏显示提供者:激活实验性功能后,提供者的状态将显示在状态栏中,提升可见性。

  • 精确清理镜像:在清理镜像时,用户可选择仅删除未标记的镜像或所有未使用的镜像。

  • 日志搜索功能:支持在容器和 Pod 的日志中搜索特定术语,方便定位信息。

  • Kubernetes 上下文监控:默认仅监控当前上下文,减少不必要的连接和资源占用。

此外,本次更新还包含其他性能优化和问题修复,进一步提升了用户体验。。

Falcosidekick 2.31.0

Falcosidekick 2.31.0 版本已于近日发布,主要更新包括:

  • 新增输出功能:引入了 OTLP Metrics 输出,允许将 Falco 事件转发至 OpenTelemetry 收集器或任何支持该协议的接收端。

  • 改进的日志系统:替换了 Falcosidekick 的日志系统,提升了未来扩展的可能性,且对用户无破坏性影响。

  • Loki 集成增强:默认情况下,转发至 Loki 的日志行现在包含源命名空间和 Pod 名称,便于在仪表板中筛选事件。

  • NATS/STAN 主题模板化:原先硬编码的 NATS/STAN 消息主题模板现在可以通过配置项 nats/stan.subjecttemplate 进行覆盖。

此外,本版本还修复了多个问题,包括:

  • Loki 负载中缺失模板化字段作为标签的问题。

  • 创建 ClusterPolicyReport 时的错误。

  • Loki HTTP 请求中缺失自定义头部的问题。

  • Prometheus 自定义字段键格式错误的问题。

用户可以通过更新 Helm 图表来体验这些新特性和修复。

关于KubeSphere

KubeSphere (https://kubesphere.io)是在 Kubernetes 之上构建的开源容器平台,提供全栈的 IT 自动化运维的能力,简化企业的 DevOps 工作流。

KubeSphere 已被 Aqara 智能家居、本来生活、东方通信、微宏科技、东软、华云、新浪、三一重工、华夏银行、四川航空、国药集团、微众银行、紫金保险、去哪儿网、中通、中国人民银行、中国银行、中国人保寿险、中国太平保险、中国移动、中国联通、中国电信、天翼云、中移金科、Radore、ZaloPay 等海内外数万家企业采用。KubeSphere 提供了开发者友好的向导式操作界面和丰富的企业级功能,包括 Kubernetes 多云与多集群管理、DevOps (CI/CD)、应用生命周期管理、边缘计算、微服务治理 (Service Mesh)、多租户管理、可观测性、存储与网络管理、GPU support 等功能,帮助企业快速构建一个强大和功能丰富的容器云平台。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/889092.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis低版本客户端Jedis2.9.0兼容高版本redis(比如redis6)不支持ACL的问题(亲测可用)

redis6版本及以上使用了acl认证 就是通过账号密码去认证,但是在之前版本都是只需要密码的,这种如果要适配,可能就要升级jedis客户端依赖的,但是一些老项目都不能随便升级的 之前的代码可能就不适配了 如果就要考虑使用现有的jedis版本 如:2.9.0 去支撑redis6的连接 以下有…

Linux 中sed命令的整行替换

Linux 中sed命令的整行替换.001、基本用法[root@PC1 test2]# ls a.txt [root@PC1 test2]# cat a.txt ## 测试文件 a UU i a UU i b q j c q y [root@PC1 test2]# sed /b/ s/.*/QQ/ a.txt ## 将匹配b的行全部替换为Q…

高科战神拨号精灵app下载设置方法

高科战神拨号助手、拨号健、全家软件下载,高科拨号精灵app使用设置方法说明:首先用安卓手机安装拨号助手app【联系图片上的V信 2081003456下载】。安装好后拨12345678进行蓝牙连接,蓝牙连接好后就可以进行操作。1拨号 2拨号 3拨号 4拨号 5拨号 关闭程序 12345678拨号设置。

Spherical Linear Interpolation and Text-Anchoring for Zero-shot Composed Image Retrieval

目录概Spherical Linear Interpolation (Slerp)Text-Anchored-Tuning (TAT)代码Jiang Y. K., Huynh D., Shah A., Chen W. and Lim S. Spherical linear interpolation and text-anchoring for zero-shot composed image retrieval. ECCV, 2024.概 本文提出了一种非常简单的 Ze…

uniapp + 微信小程序:新版canvas常用api及注意事项

关于新旧canvas的比较我以前写过一篇博客 :https://www.cnblogs.com/sunshine233/p/17014701.html ,这里就不重复了。 但在正文开始之前,我不得不再说一遍微信的文档写的真垃圾。很多问题的答案都是在微信开发者社区里找到的。一、新版canvas 基础用法:<template><…

Java 实现 Excel(XLS/ XLSX)和 HTML 格式之间的转换

Excel 是一种电子表格格式,广泛用于数据处理和分析,而HTM则是一种用于创建网页的标记语言。虽然两者在用途上存在差异,但有时我们需要将数据从一种格式转换为另一种格式,以便更好地利用和展示数据。本文将介绍如何通过 Java 实现 Excel 与 HTML 格式之间的相互转换。将Exce…

Python异步编程终极指南:用协程与事件循环重构你的高并发系统

title: Python异步编程终极指南:用协程与事件循环重构你的高并发系统 date: 2025/2/24 updated: 2025/2/24 author: cmdragon excerpt: 🚀 深入剖析Python异步编程的核心机制。你将掌握:\n 事件循环的底层实现原理与调度算法\n async/await协程的6种高级用法模式\n 异步H…

Uniapp开发安卓app之使用360加固加壳处理

Uniapp开发安卓app之使用360加固加壳处理 注:360加固只针对Android App免费。360加固助手官方下载 1.流程 安卓加固 》 签名APK 2.前提 先使用Hbuilder完成app打包,得到apk文件。 3.安卓加固1)安装、登录360加固软件并打开 2)在安卓加固》APK加固》添加任务,选择hbi…

用python画五角星

import turtle turtle.setup(500,500) turtle.bgcolor("white") turtle.pensize(3) turtle.color("red") turtle.begin_fill() for _ in range(5): turtle.forward(200) turtle.right(144) turtle.end_fill() turtle.hideturtle() turtle.done()

win10忘记开机密码怎么办?

下面我们来看看win10笔记本电脑开机密码忘记了怎么办_ 方法一、重置电脑,但是数据可能会丢失 1、开机,在看到Windows10Logo,下面有个圆圈在转的时候,数5秒。然后直接按下电源键关机。2.桌面,如果您的台式机有重新启动键,也可以直接按重新启动键。这样重复2~3次。 三、鼠标…