新品发布|灵雀云重磅推出大模型 LLMOps 平台

自即日起,灵雀云正式推出大模型 LLMOps 平台 Alauda Machine Learning (简称 AML),AML在整合传统 MLOps 解决方案的基础之上,为大模型/大语言模型场景提供更强大、更易用的功能。灵雀云意在将AML打造成全面覆盖传统 MLOps与LLMOps 场景的全栈式开发运维平台,以满足不同场景下机器学习模型的开发、部署和运维需求,为企业的创新与发展注入强大动力。

图片

图示:AML产品架构图

引言

在过往的系列文章中,灵雀云已向广大读者深入阐述了RAG、Agent、GPU虚拟化等前沿概念与技术。随着人工智能技术的高速发展,大型语言模型已然成为该领域发展的重要趋势。大模型凭借其强大的学习与泛化能力,在自然语言处理、机器翻译、图像生成等诸多领域均取得了卓越的成就。然而,传统的MLOps工作流在应对大模型时代的挑战时,已显得力不从心。于是,灵雀云归纳并总结了LLMOps的工作流,以更好地适应大模型时代的需求。

图片

图示:LLMOps的工作流

LLMOps 工作流始于预训练的大模型,是整个流程的基础,模型质量会直接影响业务应用效果。接下来,通过专业的 prompt 设计技巧,对大模型进行多角度、多场景的测试验证,确保满足业务需求。若验证成功,可选择直接发布或构建应用后发布。对于资源丰富的团队,还可对大模型进行微调,利用专业数据集训练以适应特定领域,再进行验证后发布供业务团队使用。

假设发布一个用于药物推荐的问答模型,用户可以直接向模型提问,如“感冒了,应该吃点什么药?”大模型在接收到这类问题时,可能会根据其训练数据直接回复一些药品名称。然而,感冒的症状和病因多种多样,因此,用户需要大模型进行细致的分析并提供针对性的药品推荐。

为了引导大模型从专业的角度思考问题并输出更详细、准确的回答,用户可以优化提示词,例如:“你是一个药学专家,请针对问题中的病情,从不同的病因、症状角度出发,进行用药推荐。问题:我感冒了,应该吃点什么药?”这样的提示有助于模型更深入地分析问题,并给出专业的建议。

如果用户期望大模型的回答更贴近老中医的语言风格,可以利用大量的中医对话文本数据对模型进行微调。这些数据应包含老中医在解答患者问题时的语言习惯和表达方式。经过微调后,再结合prompt工程进行优化,模型最终输出的内容可能如下:

老朽乃一介中药学之老朽,今见尔感冒之疾,愿以老朽所知,为尔指点迷津。感冒之症,或因风邪、或因寒邪、或因热邪,症状亦有不同,需辨证施治,方能药到病除……

AML 对 LLMOps 工作流的每个环节均提供了全面的工具及底层技术支持,接下来本文将深入探究 AML 的具体能力。

模型仓库

LLMOps工作流的首要步骤是准备大模型,这一过程中,模型仓库发挥着关键作用,它不仅为模型提供存储空间,还进行高效管理。在模型仓库中,用户可以轻松查看模型详情、管理文件、控制版本等。值得一提的是,AML自带的模型仓库与HuggingFace模型完全兼容,并支持多种自定义模型格式。AML在交付时,会根据用户要求内置相应模型,实现开箱即用的便捷体验。同时,支持用户自主创建模型仓库,手动上传模型文件,

并在发布推理 API 后,在模型仓库详情中直接查看模型效果。目前支持 transformers 框架文本生成、文本分类、文本到图像类型的模型,后续版本中将不断更新,丰富支持的模型类型。用户也可以通过此功能手动调整prompt 工程以及参数,优化模型效果。

图片

发布推理 API

 LLMOps 工作流中的一个关键步骤是模型的推理服务发布,它确保了模型能够高效、稳定地在实际业务场景中运行。

AML 使用 Kserve、Seldon MLServer 和 Triton 作为推理运行时框架,因此,发布的 API 服务均使用统一的 Kserve V2 HTTP REST API 接口协议。也可以通过自定义 preprocessor、postprocesser 完成自定义的格式转换。

模型的推理服务可以通过模型仓库快速将推理 API 发布到已部署 AML 平台的集群中。在边缘集群需要推理服务的场景下,也可以将推理 API 构建成镜像进行发布。推理 API 运行过程中,支持在推理 API 详情中查看运行日志,辅助故障排查,也可以支持模型的版本热更新、自动扩容配置等操作。

图片

应用仓库

AML 应用仓库支持使用 Gradio, Streamlit 开发的大模型应用,以及使用 Docker 定义的任意 AI 应用的版本化管理和自动构建发布。在 LLMOps 的工作流应用构建步骤中,可以在 AML 应用仓库中创建应用,将应用代码上传至应用仓库中进行版本化管理、镜像构建、发布应用。

图片

发布应用

在AML应用仓库页面中,支持将应用构建成镜像,并发布应用。由于部分应用需要进行环境变量或保密字典配置,因此支持创建应用配置,并以 Secrets 的方式挂载到应用中。在发布应用时也支持自定义配置环境变量。

图片

数据标注

AML 集成了 Label Studio 数据标注工具,可对接 S3 存储的各种训练数据类型。并支持多种类型数据和任务的协作标注工作,包含:机器视觉类模型、NLP、语音、音频、视频、对话 AI、Ranking 类模型、时间序列、结构化数据等。

图片

模型微调

大模型微调是使用专业领域的数据集对大模型进行进一步的训练,使其成为领域专家,在执行下游任务时,模型可以针对问题进行更专业的回答。AML提供了大模型微调的流程指导,包括:运行时镜像的构建、模型的下载、创建流水线任务等方法,帮助用户在模型仓库中快速启动微调任务。

图片

资产可视化

AML的概览页作为可视化的数据看板,清晰展示了用户资产统计信息。若ACP项目管理对AML平台命名空间设置了资源配额,概览页亦直观呈现配额与用量数据。同时,用户可便捷查看各集群中物理及虚拟GPU资源的使用情况,实现全面监控与高效管理。

图片

图片

结尾

AML v1.0 版本现已发布,全面涵盖上述各项功能及操作,满足基本的LLMOps场景需求。未来,灵雀云将致力于对LLMOps工作流中的其他关键环节进行持续迭代和优化,例如推出支持数据预览的数据集仓库、提供多样化的prompt方案、完善RAG和Agent功能,以及简化模型微调操作等。欢迎对AML及LLMOps工作流感兴趣的用户联系我们,扫描下方二维码,预约demo演示,共同探索更多可能性!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/577862.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

夏季水域安全管理,AI智能识别算法防溺水视频监控方案

随着夏季的到来,不少人为了一时的痛快凉爽就私自下水游泳,特别是在野外池塘,由于长期无人监管,极易发生人员溺亡事件,如何对池塘水域进行全天候无人值守智能监管,并实现发生人员闯入就立即告警?…

iOS UIFont-实现三方字体的下载和使用

UIFont 系列传送门 第一弹加载本地字体:iOS UIFont-新增第三方字体 第二弹加载线上字体:iOS UIFont-实现三方字体的下载和使用 前言 在上一章我们完成啦如何加载使用本地的字体。如果我们有很多的字体可供用户选择,我们当然可以全部使用本地字体加载方式,可是这样就增加了…

学习Fast-LIO系列代码中相关概念理解

目录 一、流形和流形空间(姿态) 1.1 定义 1.2 为什么要有流形? 1.3 流形要满足什么性质? (1) 拓扑同胚 (2) 可微结构 1.4 欧式空间和流形空间的区别和联系? (1) 区别: (2) 联系: 1.5 将姿态定义在流形上比…

从0到1利用express搭建后端服务

目录 1 架构的选择2 环境搭建3 安装express4 创建启动文件5 express的核心功能6 加入日志记录功能7 日志记录的好处本节代码总结 不知不觉学习低代码已经进入第四个年头了,既然低代码很好,为什么突然又自己架构起后端了呢?我有一句话叫低代码…

javaWeb项目-旅游民宿管理平台系统功能介绍

项目关键技术 开发工具:IDEA 、Eclipse 编程语言: Java 数据库: MySQL5.7 框架:ssm、Springboot 前端:Vue、ElementUI 关键技术:springboot、SSM、vue、MYSQL、MAVEN 数据库工具:Navicat、SQLyog 1、JSP技术 JSP(Jav…

视频素材免费无水印软件有哪些?视频素材免费下载素材库

在这个视觉为王的时代,一段精彩的视频能够跨越语言和文化的障碍,触动每一个心灵。对于每一位热血沸腾的视频创作者而言,寻找那些高质量无水印的素材,就像是在无尽的创意海洋中航行,在这段旅程中,我为你精选…

Polar靶场web(三)

期待得到某一件事物的时候,才是最美好的。 签到 发现不能提交,看一下f12 发现提交按钮被禁用了,且最大输入9个字符,我们可以改一下。 现随便提交一个发现要提交ilovejijcxy session文件包含 发现有文件包含,那先包含…

互联网医院APP开发攻略:搭建智能医疗平台

互联网医院APP为患者提供了便捷的就医途径,还为医生和医院提供了更加高效的服务和管理手段。接下来,小编将我们本文将就互联网医院APP的开发攻略,以及如何搭建智能医疗平台进行探讨。 1.确定需求和目标 这包括确定服务对象(患者、…

NO12 蓝桥杯单片机实践之DS1302

1 回顾 DS1302使用电子时钟模式时,使用方法为: (1)将读写寄存器的地址写成数组 (2)时间参数写成数组 (3)调用函数来进行读取实时时间(底层代码.c文件) 2…

一文读懂Unity性能分析工具:MemoryProfiler,教你轻松分析项目性能瓶颈

轻松掌握MemoryProfiler MemoryProfiler的基本概念如何获取MemoryProfileMemoryProfiler内存分析实践正常GC,合理释放对象的引用无法正常GC,对象引用没有合理释放。 总结 MemoryProfiler的基本概念 Unity 性能分析器 (Unity Profiler) 是一种可以用来获取应用程序性…

C语言结构体详解

前言: 何为结构体,结构体又是什么呢,相信有很多小伙伴对结构体还没有一个清楚的概念,今天咱也一起来探讨一下何为结构体,在C语言当中有着许多的数据类型,如char,int,long&#xff0c…

成都欣丰洪泰文化传媒有限公司电商服务的行业先锋

在当今电商行业风起云涌的时代,成都欣丰洪泰文化传媒有限公司凭借其深厚的行业积淀和敏锐的市场洞察力,已经崭露头角,成为众多电商企业争相合作的对象。欣丰洪泰不仅专注于电商服务,更是以其专业的服务理念和创新的营销策略&#…