如何让 Llama2、通义千问开源大语言模型快速跑在函数计算上?

作者:寒斜 阿里云智能技术专家 「本文是“在 Serverless 平台上构建 AIGC 应用”系列文章的第一篇文章。」

前言

随着 ChatGPT 以及 Stable Diffusion,Midjourney 这些新生代 AIGC 应用的兴起,围绕 AIGC 应用的相关开发变得越来越广泛,有呈井喷之势,从长远看这波应用的爆发不仅仅是停留在形式之上,更是在各个领域产生实际的生产力价值,比如办公领域有 copilot system 365,钉钉智能;代码编程领域有 github copilot,cursor ide; 文娱领域的妙鸭相机;可以肯定的是未来 AIGC 的应用数量会更多,类型也会更加丰富,企业的内部软件或者 SOP 都会尽可能的跟 AI 进行融合,这必然催生出海量的 AIGC 应用开发需求,这也代表着巨大的市场机会。

开发 AIGC 应用的挑战

AIGC 的应用前景如此诱人,可能决定企业未来的发展走向。然而对很多中小企业及开发者而言,上手进行 AIGC 应用的开发依然有着非常高昂的成本:

  • 基础模型服务的获取:chatgpt 提供了非常完善的 api 开发体系,然而并不开放给国内客户使用,开源的模型进行服务的部署非常困难
  • 高昂的费用, GPU 短缺导致 GPU 的费用急剧飙升,本地购买高规格显卡需要一次性花费不少的成本,并且并不能提供在线服务。
  • 端到端的对接:单纯模型服务的 api 无法变成直接的生产力,需要完成【企业数据&企业 SOP】-> LLM 服务 -> 各种端侧的完整链路

函数计算 AIGC 应用的解决方案

函数计算围绕创建和使用 AIGC,从基础设施到应用生态,开发端到使用端提供的完整的配套。

图片

主要包含三个部分:

一、模型服务底座,函数计算可以部署来自魔搭,huggingface 等开元社区的 ai 模型,我们针对 LLM,Bert 等智能知识库/助手场景做了专门的定制,接入 OpenAI 兼容的 api 规范,提供一键部署的模版和可视化的 web 访问界面,帮助开发者或者企业快速上手 llama2,chatglm2,通义千问等模型的部署。

二、业务连接层,串联业务需求以及的模型服务,安全服务,数据库服务等基础资源,这部分有在 AIGC 应用部分有很多相同的逻辑,比如账号体系,数据集管理,提示词模版,工具管理,模型服务管理等,从各业务侧视角看,不一样的部分只是 提示词,知识库以及工具集,底层的模型服务,安全服务,数据库服务则是共享的,这层可以简化业务里面构建不同智能场景的流程,快速,低成本的可以构建不同业务的 AIGC 应用。

三、客户端侧,客户端是 AI 应用的使用部分,也是最接近业务的部分,这部分更多的考虑是如何将 AI 服务融入已有的使用端,比如钉钉,企业微信等办公 IM 系统,以及 web 浏览器插件等,通过函数计算+eventbridge 可以快速帮助 ai 服务接入到这些客户端。

本篇教程先来分享一下第一个部分,如何通过函数计算快速部署 AIGC 相关模型服务包括 LLM 模型和 Embedding(Bert) 模型。

LLM 模型及 Embedding 服务部署教程

前期准备

使用该项目,您需要有开通以下服务:
服务备注
函数计算 FC对 AIGC 进行 CPU/GPU 推理计算:https://free.aliyun.com/?pipCode=fc
文件存储 NAS存储大语言模型以及 Embedding 服务所需要的模型,新用户请先领取免费试用资源包:https://free.aliyun.com/?product=9657388&crowd=personal

应用介绍

应用详情

使用阿里云函数计算部署开源大模型应用,提供兼容 openai 规范的接口和 ChatGPT-Next-Web 客户端。

ChatGPT-Next-Web:

https://github.com/Yidadaa/ChatGPT-Next-Web

图片

操作文档

llm 应用模版

登录到阿里云函数计算控制台->应用->创建应用-> 人工智能选择 AI 大语言模型 API 服务应用模板点击"立即创建"。

图片

应用模版设置

图片

图片

设置好知道点击"创建并部署默认环境"。

等待部署

该过程您会自动完成。

服务访问

图片

服务部署成功之后会返回两个链接。

  1. llm-server 为大语言模型的 api 服务界面,基于 swagger。

图片

  1. llm-client 则是访问客户端,访问客户端需要您输入前面填写的客户端私有密码,填写好之后就可以测试使用了。

图片

图片

图片

embedding 模版

登录到阿里云函数计算控制台->应用->创建应用-> 人工智能选择 “开源 Bert 模型服务” 应用模板点击"立即创建"。

图片

应用模版设置

选择好地域创建即可。

图片

等待部署

该过程您会自动完成。

服务访问

图片

测试 embedding 接口。

图片

图片

总结

部署好 LLM 服务意味着您已经开启了 AIGC 应用的开发旅程,接下来我会继续跟大家分享更多关于 AIGC 相关的内容,包括如何构建知识库问答应用,如何调用工具完善大语言模型的能力,如何接入自己的 IM 系统和构建 web 的集成插件。


宇宙漫游,阿里云 x 森马 AIGC T 恤设计大赛

一、【森马X阿里云 AIGC T 恤设计大赛】

程序员 AIGC 自己的 T 恤,赢 Airpods,图案定制 T 恤!

通过函数计算 FC 快捷部署 Stable Diffusion:内置模型库+常用插件+ControlNet,支持 SDXL1.0。

立即参加:https://developer.aliyun.com/adc/series/activity/aigc_design

可赢取 Airpods 三代,作品定制联名体恤,森马行李箱等周边!

二、参加话题活动

一起讨论 AIGC 的未来发展趋势,用户可从任意角度交流分享,可以赢得护眼台灯、数据线、静音净化器奖品!

话题:《相比优秀的服装设计师,AIGC 可以如何突破设计灵感的界限?是纯粹的机械语言还是一点点的灵光乍现?》https://developer.aliyun.com/ask/548537?spm=a2c6h.13148508.setting.14.4a894f0esFcznR

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/130510.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

浏览器详解(四) 渲染

大家好,我是半虹,这篇文章来讲浏览器渲染 1、基本介绍 浏览器是多进程多线程的架构,包括有浏览器进程、渲染器进程、GPU 进程、插件进程等 在上篇文章中我们介绍过浏览器进程,作为浏览器主进程,负责浏览器基本界面的…

【Java 进阶篇】CSS盒子模型详解

CSS盒子模型是网页布局的基础之一,它定义了HTML元素在页面上的占用空间和相互关系。理解CSS盒子模型对于构建各种类型的网页布局至关重要。在本文中,我们将深入探讨CSS盒子模型的各个方面,包括盒子模型的概念、属性和如何使用它们来控制元素的…

2023年山东省安全员C证证考试题库及山东省安全员C证试题解析

题库来源:安全生产模拟考试一点通公众号小程序 2023年山东省安全员C证证考试题库及山东省安全员C证试题解析是安全生产模拟考试一点通结合(安监局)特种作业人员操作证考试大纲和(质检局)特种设备作业人员上岗证考试大…

/lib64/libstdc++.so.6: version `GLIBCXX_3.4.21‘ not found (required by

在某项目中遇到下面的错误, ./model2trt_v2: /lib64/libstdc.so.6: version GLIBCXX_3.4.21 not found (required by ./model2trt_v2) ./model2trt_v2: /lib64/libstdc.so.6: version GLIBCXX_3.4.21 not found (required by ../../../lib/linux_lib/libcuda_utils…

爬虫破解:解决CSRF-Token反爬问题 - 上海市发展和改革委员会

标题:爬虫破解:解决CSRF-Token反爬问题 - 上海市发展和改革委员会 网址:https://fgw.sh.gov.cn/fgw-interaction-front/biz/projectApproval/home MD5加密:ca7f5c978b1809d15a4b228198814253 需求文档 采集数据如下所示: 解决反爬思路 这里只提供解决思路,解决反爬,…

远程发送剪切板,屏幕截图

使用场景 线上答题时一般有录屏,局域网内可发送内容到电脑上剪切板,电脑上直接CtrlV双机位看不到屏幕是可以远程截屏 下载 访问地址下载程序:https://gitee.com/guzhengchang/shared-clipboard/releases/tag/v0.2 双击前面下载的程序&am…

系统打印服务已关闭,竟然是它的问题!

故障现象: 一台电脑不能打印文件,一点打印就弹出对话框提示打印服务已关闭。手动开启打印服务后,大约不到1分钟打印服务又自动关闭了。 故障检修: 电脑重新启动后再次重启打印服务,打印服务依然还是会自动关闭。估计是…

docker搭建jenkins

1.拉取镜像 docker pull jenkinsci/blueocean2.启动容器 docker run -d -u root -p 8666:8080 -p 50000:50000 -v /var/jenkins_home:/var/jenkins_home -v /etc/localtime:/etc/localtime --name MyJenkins jenkinsci/blueocean3.访问ip:port,就能访问了 4.docker logs 容器…

面试总结-Redis篇章(十二)——Redis是单线程的,为什么还那么快

Redis是单线程的,为什么还那么快 Redis是单线程的,为什么还那么快什么是IO多路复用 阻塞IO非阻塞IOIO多路复用 Redis是单线程的,为什么还那么快 Redis是纯内存操作,执行速度非常快采用单线程,避免不必要的上下文切换可…

javaScript:什么是事件对象?事件原对象?如何获取坐标点?

目录 前言 事件对象(***重要***) 事件对象的常见用处 相关代码 事件原对象 获取事件源对象的方式 获取坐标点 clientX clientY(常用) screenX screenY pageX pageY 兼容写法 (ie8以下) 其他坐标…

想要开发一款游戏, 需要注意什么?

开发一款游戏是一个复杂而令人兴奋的过程。游戏开发是指创建、设计、制作和发布电子游戏的过程。它涵盖了从最初的概念和创意阶段到最终的游戏发布和维护阶段的各个方面。 以下是一些需要注意的关键事项: 游戏概念和目标: 确定游戏开发的核心概念和目标…

数据结构与算法设计分析——贪心算法的应用

目录 一、贪心算法的定义二、贪心算法的基本步骤三、贪心算法的性质(一)最优子结构性质(二)贪心选择性质 四、贪心算法的应用(一)哈夫曼树——哈夫曼编码(二)图的应用——求最小生成…