本次课程由书生·浦语社区贡献者【北辰】老师讲解【茴香豆:搭建你的 RAG 智能助理】课程
课程视频:https://www.bilibili.com/video/BV1QA4m1F7t4/
课程文档:Tutorial/huixiangdou/readme.md at camp2 · InternLM/Tutorial · GitHub
该课程,分为3个部分来讲解 :
- RAG基本概念、原理 ,RAG和Fine-tune异同点,等
- 茴香豆介绍
- 实战演示
InternLM2-Chat-7B
与茴香豆助手对于“huixiangdou是什么?”问题回答的对比
可见未经过模型参数任何更新,通过RAG技术可以增强模型回答的能力
RAG概述
RAG(Retrieval Augmented Generation)技术,通过检索与用户输入相关的信息片段,并结合外部知识库来生成更准确、更丰富的回答。解决 LLMs 在处理知识密集型任务时可能遇到的挑战, 如幻觉、知识过时和缺乏透明、可追溯的推理过程等。提供更准确的回答、降低推理成本、实现外部记忆。
向量数据库
RAG流程示例:
RAG分为三类:
- Naiva RAG :问答系统、信息检索
- Advanced RAG: 摘要生成、内容推荐
- Modular RAG: 多模态任务、对话系统
RAG常见优化方法如下:
RAG与微调的异同点:
LLM模型优化方法:Fine-tuning、Prompt Engineer、RAG
评估指标:
茴香豆:
是一个基于LLMs的领域知识助手,由书生浦语团队开发的开源大模型应用。
- 专为即时通讯(IM)工具中的群聊场景优化的工作流,提供及时准确的技术支持和自动问答服务
- 通过应用检索增强生成(RAG)技术,茴香豆能够理解和高效准确的回应与特定知识领域相关的复杂查询。
实战演练部分,见:茴香豆:搭建你的RAG智能助理-作业三