用通俗易懂的方式讲解：在企业算法项目落地中，大模型能力增强最常用的两种方式-编程知识

用通俗易懂的方式讲解：在企业算法项目落地中，大模型能力增强最常用的两种方式

news/2025/3/15 17:36:51/文章来源:https://blog.csdn.net/2301_78285120/article/details/136054186

如何对 LLM 大模型增强？

对 LLM 大模型能力增强在企业有两种实践路线：RAG 和 Fine-tuning。接下来我们详细剖析下这两种增强实现方式。

第一：检索增强生成 RAG（Retrieval Augmented Generation）实现方式

2020 年，Lewis et al. 的论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》提出了一种更为灵活的技术：检索增强生成（RAG）。在这篇论文中，研究者将生成模型与一个检索模块组合到了一起；这个检索模块可以用一个更容易更新的外部知识源提供附加信息。

用大白话来讲：RAG 之于 LLM 就像开卷考试之于人类。在开卷考试时，学生可以携带教材和笔记等参考资料，他们可以从中查找用于答题的相关信息。开卷考试背后的思想是：这堂考试考核的重点是学生的推理能力，而不是记忆特定信息的能力。

类似地，事实知识与 LLM 大模型的推理能力是分开的，并且可以保存在可轻松访问和更新的外部知识源中：

参数化知识：在训练期间学习到的知识，以隐含的方式储存在神经网络权重之中。
非参数化知识：储存于外部知识源，比如向量数据库。

上图检索增强生成（RAG）的工作流程如下所示：

1、检索（Retrieval）：将用户查询用于检索外部知识源中的相关上下文。为此，要使用一个嵌入模型将该用户查询嵌入到同一个向量空间中，使其作为该向量数据库中的附加上下文。这样一来，就可以执行相似性搜索，并返回该向量数据库中与用户查询最接近的 k 个数据对象。

2、增强（Augmented）：然后将用户查询和检索到的附加上下文填充到一个 prompt 模板中。

3、生成（Generation）：最后，将经过检索增强的 prompt 馈送给 LLM。

第二：微调（Fine-tuning）实现方式

通过微调模型，可以让神经网络适应特定领域的或专有的信息。

微调技术按照参数量不同，分为全参数微调和局部参数微调，由于全参数微调周期比较长，微调成本和一次预训练成本差别不大，因此全参数微调在实际企业级生产环境中基本不使用，更有效的微调方式是少参数量微调，比如：基于 LoRA、Prompt tuning、Prefix tuning、Adapter、LLaMA-adapter、P-Tuning V2 等微调技术。

基于 LoRA 可以高效进行微调，通过把微调参数量减少为万分之一，达成同样的微调效果。

微调技术是有效的，但其需要密集的计算，成本高，还需要技术专家的支持，因此需要对微调技术有一定的认知和掌握，才能做好微调。

技术交流&资料

技术要学会分享、交流，不建议闭门造车。一个人可以走的很快、一堆人可以走的更远。

成立了大模型技术交流群，本文完整代码、相关资料、技术交流&答疑，均可加我们的交流群获取，群友已超过2000人，添加时最好的备注方式为：来源+兴趣方向，方便找到志同道合的朋友。

方式①、微信搜索公众号：机器学习社区，后台回复：加群
方式②、添加微信号：mlc2060，备注：来自CSDN + 技术交流

通俗易懂讲解大模型系列

做大模型也有1年多了，聊聊这段时间的感悟！
用通俗易懂的方式讲解：大模型算法工程师最全面试题汇总
用通俗易懂的方式讲解：不要再苦苦寻觅了！AI 大模型面试指南（含答案）的最全总结来了！
用通俗易懂的方式讲解：我的大模型岗位面试总结：共24家，9个offer
用通俗易懂的方式讲解：大模型 RAG 在 LangChain 中的应用实战
用通俗易懂的方式讲解：一文讲清大模型 RAG 技术全流程
用通俗易懂的方式讲解：如何提升大模型 Agent 的能力?
用通俗易懂的方式讲解：ChatGPT 开放的多模态的DALL-E 3功能，好玩到停不下来！
用通俗易懂的方式讲解：基于扩散模型（Diffusion）,文生图 AnyText 的效果太棒了
用通俗易懂的方式讲解：在 CPU 服务器上部署 ChatGLM3-6B 模型
用通俗易懂的方式讲解：使用 LangChain 和大模型生成海报文案
用通俗易懂的方式讲解：ChatGLM3-6B 部署指南
用通俗易懂的方式讲解：使用 LangChain 封装自定义的 LLM，太棒了
用通俗易懂的方式讲解：基于 Langchain 和 ChatChat 部署本地知识库问答系统
用通俗易懂的方式讲解：在 Ubuntu 22 上安装 CUDA、Nvidia 显卡驱动、PyTorch等大模型基础环境
用通俗易懂的方式讲解：Llama2 部署讲解及试用方式
用通俗易懂的方式讲解：基于 LangChain 和 ChatGLM2 打造自有知识库问答系统
用通俗易懂的方式讲解：一份保姆级的 Stable Diffusion 部署教程，开启你的炼丹之路
用通俗易懂的方式讲解：对 embedding 模型进行微调，我的大模型召回效果提升了太多了
用通俗易懂的方式讲解：LlamaIndex 官方发布高清大图，纵览高级 RAG技术
用通俗易懂的方式讲解：为什么大模型 Advanced RAG 方法对于AI的未来至关重要？
用通俗易懂的方式讲解：使用 LlamaIndex 和 Eleasticsearch 进行大模型 RAG 检索增强生成
用通俗易懂的方式讲解：基于 Langchain 框架，利用 MongoDB 矢量搜索实现大模型 RAG 高级检索方法
用通俗易懂的方式讲解：使用Llama-2、PgVector和LlamaIndex，构建大模型 RAG 全流程

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/455706.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

MongoDB从入门到实战之Docker快速安装MongoDB

MongoDB从入门到实战之Docker快速安装MongoDB

前言在上一篇文章中带领带同学们快速入门MongoDB这个文档型的NoSQL数据库，让大家快速的了解了MongoDB的基本概念。这一章开始我们就开始实战篇教程，为了快速把MongoDB使用起来我将会把MongoDB在Docker容器中安装起来作为开发环境使用。然后我这边MongoD…

阅读更多...

前端工程化之：webpack3-5(css module)

前端工程化之：webpack3-5(css module)

目录一、css module 1.思路 2.实现原理 3.如何应用样式 4.其他操作 （1）全局类名 （2）如何控制最终的类名 5.其他注意事项一、css module 通过命名规范来限制类名太过死板，而 css in js 虽然足够灵活&…

阅读更多...

ShardingSphere 5.x 系列【6】YAML 配置介绍

ShardingSphere 5.x 系列【6】YAML 配置介绍

有道无术，术尚可求，有术无道，止于术。本系列Spring Boot 版本 3.1.0 本系列ShardingSphere 版本 5.4.0 源码地址：https://gitee.com/pearl-organization/study-sharding-sphere-demo 文章目录 1. 前言2. YamlConfiguration3. 常用配置项3.1 JDBC 驱动3.2 数据源3.3 规则…

阅读更多...

【Python】Mac 本地部署 stable-diffusion

【Python】Mac 本地部署 stable-diffusion

其实要在本地部署 stable-diffusion 不难，只要有“魔法”一切都水到渠成，如下图： (base) MacBook-Pro python % git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui Cloning into stable-diffusion-webui... remote: Enu…

阅读更多...

Mac 下JDK环境变量配置及 JDK多版本切换

Mac 下JDK环境变量配置及 JDK多版本切换

一、推荐官网下载： 二、环境变量配置 1、查看JDK地址，在终端输入以下命令： /usr/libexec/java_home -V 我的路径： /Library/Java/JavaVirtualMachines/jdk-17.jdk/Contents/Home /Library/Java/JavaVirtualMachines/zulu-11.j…

阅读更多...

鸿蒙开发系列教程（十二）--布局应用：Flex布局

鸿蒙开发系列教程（十二）--布局应用：Flex布局

相关属性参数与css3的flex布局参数相似排列方向：direction: FlexDirection.Row, 换行：wrap: FlexWrap.NoWrap, 水平垂直对齐方式： justifyContent: FlexAlign. SpaceBetween, alignItems: ItemAlign.Center Entry Component struct Flex…

阅读更多...

Redis核心技术与实战【学习笔记】 - 21.Redis实现分布式锁

Redis核心技术与实战【学习笔记】 - 21.Redis实现分布式锁

概述在《20.Redis原子操作》我们提到了应对并发问题时，除了原子操作，还可以通过加锁的方式，来控制并发写操作对共享数据的修改，从而保证数据的正确性。但是，Redis 属于分布式系统，当有多个客户端需要争…

阅读更多...

C++多线程：this_thread 命名空间

C++多线程：this_thread 命名空间

std::this_thread 是 C 标准库中提供的一个命名空间，它包含了与当前线程相关的功能。这个命名空间提供了许多与线程操作相关的工具，使得在多线程环境中更容易进行编程。源码类似于如下： namespace std{namespace this_thread{//...........…

阅读更多...

JAVA面试汇总总结更新中ing

JAVA面试汇总总结更新中ing

本人面试积累面试题多线程微服务JVMKAFKAMYSQLRedisSpringBoot/Spring 1.面向对象的三个特征封装，继承，多态，有时候也会加上抽象。 2.多态的好处允许不同类对象对同一消息做出响应，即同一消息可以根据发送对象的不同而采用多种…

阅读更多...

苹果手机如何录屏？这里告诉你答案！

苹果手机如何录屏？这里告诉你答案！

苹果公司的iPhone以其卓越的性能和用户体验受到了全球消费者的喜爱，而录屏功能作为手机的一项重要功能，能够帮助我们记录手机屏幕上的操作，分享游戏技巧、制作教程视频等。本文将为您介绍苹果手机如何录屏，帮助您更好地掌握录屏技…

阅读更多...

国内唯一！通义灵码入选全球智能编码助手使用率 TOP 榜单

国内唯一！通义灵码入选全球智能编码助手使用率 TOP 榜单

近日，在国内知名科技媒体 InfoQ 研究中心发布的《中国软件技术发展洞察和趋势预测报告 2024》中提到，随着 AI 和大模型技术的普及，开发者智能编码助手的使用习惯已经养成，其中，开发者使用的智能编码助手产品使用率超过…

阅读更多...

C语言：内存函数

C语言：内存函数

创作不易，友友们给个三连吧！！ C语言标准库中有这样一些内存函数，让我们一起学习吧！！ 一、memcpy函数的使用和模拟实现 void * memcpy ( void * destination, const void * source, size_t num ); 1.1 使…

阅读更多...

推荐文章

最新文章