面向 “大模型” 的未来服务架构设计

文章目录

    • 大模型热潮
    • 大模型落地
      • 服务设计 or 重构
      • 未来的服务架构
          • 微服务化
          • 分层化
        • 大模型应用架构
          • 架构设计图
          • 架构 Demo 实现
    • 小结
    • 附录

大模型热潮

在这里插入图片描述

今年的互联网赛道中 “顶流” 非大模型莫属。 科技部新一代人工智能发展研究中心 5 月底发布的《中国人工智能大模型地图研究报告》显示,我国 10 亿参数规模以上的大模型已发布79个,几乎进入“百模大战”。

百度的文心一言 ,阿里的通义千问、讯飞星火大模型、智谱AI的ChatGLM 等纷纷发布。此后,美团、百川智能、云知声、美图、腾讯……新加入大模型赛道的国内科技公司此起彼伏,一场围绕大模型的 “军备竞赛” 已趋白热化。

大模型落地

ChatGPT 掀起 AI 热之后,微软已经成为这股浪潮中最重要的企业之一。不仅因为其是 OpenAI 的大股东,或者推出 AI 加持的 New Bing。

在这里插入图片描述

更重要的是:作为全球第一大操作系统服务商、全球第一大办公软件开发商,以及全球第二大云服务商,微软更是提出 “旗下全部产品将和大模型组件融合,全面拥抱大模型落地。

中关村论坛2023上,李彦宏以《大模型改变世界》为题,也提出 “百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构….“

毫不客气的预测,未来的服务将会全部面向或依托 “大模型” 提供产品服务。

那么面向未来 “大模型” 的服务应该如何设计或重构呢/?

服务设计 or 重构

为支持 “大模型” 调用,服务需要重新定位,成为 “底座” 。这里的底座,可理解为 “大模型” 的落脚点:目标数据的吞吐。
在这里插入图片描述

强悍的 “大模型” ,重新定义人机交互。 在短时间内分析出用户的诉求,并针对诉求去提供目标服务。现行的,通过用户手动触发 App 静态接口的交互模式被打破,变成了通过 “大模型” AI 化分析诉求后,进行单个或多个目标服务接口的触发,最终汇总、裁剪各服务响应数据,进行服务功能产出。

举个例子:在地图场景中,
客A:帮我规划一下十一北京旅游路线…
地图:北京景点 -> 十一天气 -> 景点评分 -> 景点间合适的浏览顺序编排 -> …

基于这种交互的特征、并结合 云原生中 分布式、微服务等多种技术概念,我们可以对服务进行重构升级或重新设计。

未来的服务架构

微服务化

为了支撑未来 “大模型” 的交互模式,满足各种任意的服务装配、拼装。我们需要将服务进行最小粒度封装,这也延续了微服务的核心思想。

分层化

这里需要注意的是,现行的交互模式依旧存在。我们要用最小的成本,兼并支撑两种交互模式。那就需要引入 “分层” 的设计思路,将不同的交互模式进行抽象、分化为不同的逻辑层。

这里介绍一种模式,如下:

大模型应用架构

架构模式分为 入口层、大模型结果调用层、协议层、业务内聚层、数据访问层、微服务调用层。

架构设计图

在这里插入图片描述

如上图中各逻辑层:

  • 入口层
    • 完成中间件的注册任务,为后续服务功能提供基础能力支撑。包含
      • 接口 token 鉴权【Sign加盐模式】、
      • 服务异常捕获【Panic Recover 中间件:捕获服务异常,防止主程序 panic】、
      • 监控服务注册【Prometheus 指标采集】、
      • 日志中间件【初始化日志功能,打印访问日志 Access_log 】、
      • Mesh 服务注册【Proxyless Service Mesh 进行流量熔断限流、防调用雪崩…】
  • 大模型调用层
    • 为大模型提供 “底座” 能力,基于大模型的产出结果,提供对应服务的 API 调用能力。包含 复合、单协议 两种服务粒度协议
  • 协议层
    • 包含复合协议、单协议两种类型,为业务、大模型调用提供内容数据输出。
      • 单协议,针对服务最小粒度封装的 API 接口
      • 复合协议,针对多服务进行拼装后,封装的 API 接口
  • 业务内聚层
    • 为复合协议对应的服务聚合层。在此层进行多个服务的串/并编排,对外提供服务聚合数据
  • 数据裁剪层
    • 在服务调用层之上,是对每个服务的请求、响应 数据的独立封装
  • 微服务调用层
    • 基于多种通信协议,完成服务调用
  • 另外分别为 Util 和 Tool 部分
    • 贯穿服务,提供公共能力及可观测、稳定性相关的能力支撑
架构 Demo 实现
//篇幅有限,见后续博文

小结

在竞争日益激烈、全球复杂多变的现状下,企业、团队只有掌握先机,提前布局,才会成为最终的胜者,拥有绝对的敏捷竞争力!

附录

  • 五分钟搭建基于 Prometheus + Grafana 实时监控系统
  • 千万级入口服务[Gateway]框架设计(三:分层模式)
  • 云原生应用架构的迁移 一 :增量迁移范式

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/15601.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux下使用curl命令发送GET和POST请求

目录: 1、发送get请求带请求头2、发送post请求带请求头带参数 1、发送get请求带请求头 curl -X GET "http://localhost:8080/onlinePreviewCallbackApiManagement/v1/3rd/file/info" -H "accept: */*" -H "X-Weboffice-File-Id: 123"…

图像增广:强化深度学习的视觉表现力

目录 摘要: 1. 图像增广简介 2. 图像增广的原理 3. 常见的图像增广技术 4. 如何在实际项目中应用图像增广 5.实际应用 摘要: 当今,深度学习已经在计算机视觉领域取得了令人瞩目的成就。图像增广作为一种数据处理技术,让我们…

FreeRTOS ~(七)互斥量 ~ (2/3)互斥量解决优先级反转问题

前情提要 FreeRTOS ~(四)同步互斥与通信 ~ (2/3)互斥的缺陷 FreeRTOS ~(五)队列的常规使用 ~ (2/5)队列解决互斥缺陷 FreeRTOS ~(六)信号量 ~ (2/…

swiftUI和swift的区别

概述 SwiftUI是苹果公司推出的一种用于构建iOS、macOS、watchOS和tvOS应用程序界面的框架。它是基于Swift编程语言开发的,旨在简化UI开发过程并提供实时预览功能,使开发人员可以更快地构建出漂亮的应用程序界面。 Swift是苹果公司推出的一种面向对象的…

Openlayers实战:overlay上播放视频

在企业或者城市等的宣传上,视频能很好的传达出一些信息。 那么在openlayer中如何展示视频呢, 可以通过overlay的方式,点击某一个点,弹出overlay层,展示出视频,并自动播放。下面的实战就能够达到这种效果。 效果图 源代码 /* * @Author: 大剑师兰特(xiaozhuanlan),还…

OPPO手机便签怎么设置字体颜色?便签调整字体颜色方法

OPPO是一个非常受年轻人青睐的手机品牌,它的手机不仅外观设计时尚轻薄,而且拍照清晰、系统流畅,并且拥有高中低不同档次的价位可供消费者选择。虽然OPPO手机的使用体验非常不错,但是有一部分用户也遇到了一些问题,例如…

牛客小白月赛75 DE

D 矩阵 登录—专业IT笔试面试备考平台_牛客网 思路:我们能够发现每个点最多只用两种状态,一种是不变,另一种是改变,如果相邻的点与当前点不相同,则可以花费一个单位走过去,否则需要先改变它的状态&#x…

第2集丨JavaScript 中原型链(prototype chain)与继承

目录 一、一些基础概念1.1 ECMAScript 标准1.2 prototype和 __proto__1.3 constructor属性1.4 函数名 二、原型链的维护2.1 内部原型链和构造器原型链2.2 从实例回溯原型链2.3 修正原型指向 三、基于原型链的继承3.1 继承属性3.2 继承“方法” 四、构造函数4.1 案例一个简单的实…

Android加快你的编译速度

工欲善其事,必先利其器。如果每次运行项目都要花费5-10分钟,那人的心态都要崩了。 Gradle构建流程 Gradle 的生命周期可以分为大的三个部分:初始化阶段(Initialization Phase),配置阶段(Configuration Pha…

Linux性能优化实践——CPU上下文

CPU上下文切换 Linux是一个多任务操作系统,它支持远大于CPU数量的任务同时运行。这些任务不是真正意义上的并行运行,而是系统在短时间内,将CPU轮流分配给它们,造成任务同时运行的错觉。 CPU需要知道任务从哪里加载,从…

Elasticsearch【域的属性、分词器、Elasticsearch搜索文档】(三)-全面详解(学习总结---从入门到深化)

目录 Elasticsearch常用操作_域的属性 分词器_默认分词器 分词器_IK分词器 分词器_拼音分词器 分词器_自定义分词器 Elasticsearch搜索文档_准备工作 Elasticsearch搜索文档_搜索方式 Elasticsearch常用操作_域的属性 index 该域是否创建索引。只有值设置为true&#…

CCF-CSP真题《202303-4 星际网络II》思路+python,c++满分题解

想查看其他题的真题及题解的同学可以前往查看:CCF-CSP真题附题解大全 试题编号:202303-4试题名称:星际网络II时间限制:2.0s内存限制:1.0GB问题描述: 问题描述 随着星际网络的进一步建设和规模的增大&#x…