垂类大模型 研发方向与具体方案调研

垂类大模型 研发方向与具体方案调研

文章目录

  • 垂类大模型 研发方向与具体方案调研
    • 一、研发方向调研初步汇总
    • 二、垂类大模型研发背景与策略选择
      • 1、垂类大模型研发背景
      • 2、垂类大模型研发策略选择
        • (1)重新训练:
        • (2)二次预训练:
        • (3)基础大模型微调:
        • (4)通用大模型+向量知识库:
        • (5)In context learning类似微调:
    • 三、垂类大模型实现流程
      • 1、整体流程

一、研发方向调研初步汇总

初步选定垂类大模型研发技术栈如下:

  • LLM框架: LLaMA2 38k Star
  • 向量数据库:Chroma 8k Star
  • LLM应用程序构建:Langchain 58.4 Star

主要训练策略:通用大模型+向量知识库:领域知识库加上通用大模型,针对通用大模型见过的知识比较少的问题,利用向量数据库等方式根据问题在领域知识库中找到相关内容,再利用通用大模型强大的summarization和qa的能力生成回复,完成本次垂直大模型研发。

涉及方向确立的主要参考资料:
1、CLiB中文大模型能力评测榜单(持续更新)
2、主流向量数据库一览
3、一文了解:打造垂域的大模型应用ChatGPT
4、浅谈垂直领域大模型
5、垂直领域大模型的一些思考及开源模型汇总
6、如何将本地知识库接入大模型?
模型部署参考教程:
1、超详细Llama2部署教程——个人gpt体验攻略!
2、LLAMA2一键可运行整合包:Windows10+消费级显卡可用(Meta大语言模型)

二、垂类大模型研发背景与策略选择

1、垂类大模型研发背景

目前很多企业希望将大模型的能力应用到企业内部当中,但很多通用大模型只是一个预训练模型,其所能回答的知识主要来源于互联网上公开的通用知识库,对于部分垂直领域和企业内部的私有知识库的问答,给出的回答往往是大众性质的、普适化的,而非个性化的。面对有时无法让用户得到满意的答案。

2、垂类大模型研发策略选择

下面是目前垂直行业大模型的五种训练策略的简要介绍:

(1)重新训练:

使用通用数据和领域数据混合,from scratch(从头开始)训练了一个大模型,最典型的代表就是BloombergGPT。

(2)二次预训练:

在一个通用模型的基础上做continue pretraining(继续预训练,二次预训练),像LawGPT就是做了二次预训练的。有很多团队尝试过这个方案,但普遍反应效果一般(没有SFT来得直接)。

(3)基础大模型微调:

在一个通用模型的基础上做instruction tuning(sft),这也是现在开源社区最普遍的做法,有大量的工作比如Huatuo,ChatLaw等等。这种做法的优势是可以快速看到不错的结果,但会发现要提高上限比较困难。

(4)通用大模型+向量知识库:

领域知识库加上通用大模型,针对通用大模型见过的知识比较少的问题,利用向量数据库等方式根据问题在领域知识库中找到相关内容,再利用通用大模型强大的summarization和qa的能力生成回复。

(5)In context learning类似微调:

直接用in context learning的方法,通过构造和领域相关的prompt,由通用大模型直接生成回复。随着业界把context window越做越大,prompt中可以放下越来越多的领域知识,直接用通用大模型也可以对领域问题有很好的回复。

以上五种策略对硬件资源+数据 的消耗也是不同的:像【重新训练】一样几乎重新训练一遍模型,需要几百张卡。也可以像【基础大模型微调】一样用几百条数据做做sft,可能几张卡就够了。
综合目前的LLM技术发展前景,以及具体的资源消耗。目前很多垂类大模型的技术解决方案,以【基础大模型微调】+【向量知识库】为主。

三、垂类大模型实现流程

1、整体流程

1、大模型本地化部署:垂类大模型的效果与底座性能息息相关,研发垂类大模型第一步就是确定开源大模型解决方案。
在这里插入图片描述
参考综合能力排行榜,我们主要选择llama2,做为我们研发的底座。
Github跳转地址:https://github.com/facebookresearch/llama
部署教程:超详细Llama2部署教程——个人gpt体验攻略!
2、本地垂类领域知识库的搭建:收集整理垂类相关的领域知识/企业知识/专业知识,将垂直行业领域的知识库文档进行Embedding向量化处理,并将处理后的语义向量Vectors存入向量数据库Vector Database中(这个步骤中还包括对非结构化数据先转化成文本数据,并对长文本进行Splitter分割处理)。

3、用户问题向量化:将用户的问题进行向量化Embedding处理,转化为Vector search

4、得到TopN条匹配知识:将用户问题Vector search 和向量数据库进行查询匹配,返回相似度最高的TopN条知识文本
5、构建Prompt,调用OpenAI API:将匹配出的文本和用户的问题上下文一起提交给 LLM,根据Prompt生成最终的回答

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/284338.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

springCould-从小白开始【1】

目录 1.说明 2.父工程 3.服务端 4.消费者 5.公共模块 6.RestTemplate 1.说明❤️❤️❤️ 创建三个模块,服务者,消费者,公共api 注:spring boot和spring cloud有版本约束 2.父工程 ❤️❤️❤️ 约定版本号配置 注意&…

全网最详细的postman接口测试教程,一篇文章满足你

1、前言 之前还没实际做过接口测试的时候呢,对接口测试这个概念比较渺茫,只能靠百度,查看各种接口实例,然后在工作中也没用上,现在呢是各种各样的接口都丢过来,总算是有了个实际的认识。因为只是接口的功能…

散户真正的机会在一级市场,进场价格决定获利空间的大小!

在币圈,一级市场往往被视为价值投资的起点。这是因为一级市场的代币价格相对较低,因此有很大的上涨空间。一旦代币上线交易所,价格上涨,早期投资者和机构就可以获得丰厚的利润。 此外,一级市场也是发现优质项目的好机会…

演讲回顾:贝壳研发效能实践分享

5月20日,贝壳找房研发效能专家乔晓琳在由中国信通院和 QECon 组委会联合举办的技术沙龙活动中分享了贝壳研发效能实践经验。 产业背景:研发效能的新形势与新挑战 历史演进:贝壳找房研发效能之路 效能基建:业务研端到端协同平台 …

VueStu01-Vue是什么

1.概念 Vue 是一个 用于构建用户界面 的 渐进式 框架 。 2.构建用户界面 基于数据渲染出用户看到的页面。 3.渐进式 Vue的学习是循序渐进的,可以学一点用一点,不必全部学完才能用。哪怕你只学了 声明式渲染 这一个小部分的内容,你也可以完成…

Appcelerator打包ipa有哪些优势

大家好,我是咕噜-凯撒,我们得先知道Appcelerator是啥,Appcelerator(现在更名为Axway Titanium)是一个跨平台的移动应用开发框架通过提供一种简化和加速移动应用开发的方式帮助你构建高质量的跨平台应用程序。那使用App…

CODESYS的Robotics_PickAndPlace_without_Depictor例程解释

1.简介 在CODESYS的例程中,有一个例程演示了如何控制delta机械手从一个移动的转盘中拾取一个工件(ring,圆环),然后放到移动的传送带上的托盘(cone,圆锥)中。这个例程在【C:\Program…

curl+postman 在java开发中的使用(提高效率)

概念 curl 是一个常用的命令行工具,用于发送各种类型的 HTTP 请求,包括 GET、POST、PUT、DELETE 等。它也可以用来下载文件、上传文件、设置 cookie、发送 multipart/form-data 等等。 使用 调用post接口 实际中的接口: curl --location…

风力发电机行星齿轮箱数据集 | 写论文再也不用担心没数据集啦!

风力发电机行星齿轮箱数据集 | 写论文再也不用担心没数据集啦! 继上次推荐的航空发动机轴承数据集,今天给大家推荐一个风力发电机行星齿轮箱公开数据集,该数据集是继东南大学行星齿轮箱数据集的第2个行星齿轮箱数据集,该数据集有…

基于FPGA的视频接口之高速IO

简介 相对于其他视频接口来说,高速IO接口(以Xilinx公司为例,spartan 6系列的GTP、Artix7系列的GTP,KENTEX7系列的GTX和GTH等)具有简化设计、充分利用FPGA资源、降低设计成本等功能。 高速IO接口传输视频,一般会被拓展为万兆以太网、40G以太网、10G光纤、40G光纤、3G-SDI、…

C语言 文件I/O(备查)

所有案列 跳转到其他。 文件打开 FILE* fopen(const char *filename, const char *mode); 参数:filename:指定要打开的文件名,需要加上路径(相对、绝对路径)mode:指定文件的打开模式 返回值:成…

算法模板之双链表图文详解

🌈个人主页:聆风吟 🔥系列专栏:算法模板、数据结构 🔖少年有梦不应止于心动,更要付诸行动。 文章目录 📋前言一. ⛳️使用数组模拟双链表讲解1.1 🔔为什么我们要使用数组去模拟双链表…