第三节课《香豆:搭建你的 RAG 智能助理》

 一、笔记

RAG搜索引擎,用户输入就是搜索内容。

RAG三个部分:index、retrieval、generation。

将检索内容给和原问题一起作为提示prompt输入到LLM中

数据存储:将数据通过其他模型转换为固定长度的向量表示。

相似性检索:查询向量和数据库存储向量余弦相似性度量。

向量表示优化:与模型结果好坏息息相关

无关数据出现幻觉。

传统问答:提问query-->大模型LLM-->回答answer

RAG:提问query-->向量化embedding--->搜索indexing-->检索retieval->

            问题+检索结果作为提示词prompts-->生成generation-->回答answer

不断更新向量数据库,就能不断的处理新的数据。

Naive RAG:只有索引、检索、生成。运用在问答系统和信息检索。

Advanced RAG:检索前后都进行增强,检索的问题路由扩展,检索到的信息进行重排序总结融合,运用在摘要生成和内容推荐。

Modular RAG: 将RAG基础部分和后续功能进行模块化,根据业务进行定制,完成多模态任务、对话系统等更高级的任务。

提升向量库的质量:

        嵌入优化:增强嵌入性能

        索引优化:提升索引质量

查询优化:更适应查询

上下文管理:减少冗余信息,提升大模型效率。

检索:

        迭代检索:根据检索结果多次迭代检索知识,提供知识基础。

        递归检索:改进检索结果的深度和相关性,

        自适应检索:

LLM:定向微调、针对性微调。

 

微调、提示工程、RAG

任务对外部知识需求

任务对模型适配度的需求

提示工程:对外部知识和适配度都比较差,不能适应新的知识,同时对特定专业知识也很难专业的回复

微调:对外部数据需求不高,但对模型任务适配度很高。

RAG:  对外部数据需求高,但对模型任务适配度不高。

融合三种方法:

检索阶段、生成阶段分开评价

茴香豆

无需训练。

非有效数据,无法分析真实意图,结合LLM和RAG,提取有效信息

开源免费、本地部署、远端部署

知识库:实时更新的专业领域数据,多种文件格式,设置接受处理范围。

前端:回答平台

大模型:本地(书生浦语、千亿千问)、远端API

预处理:输入筛选,转换问询

拒答工作流:分析、比较相关性得分

回答工作流:相关性得分达到,开始回答

LLM scroing阈值设定问答助手回答的是话痨还是严谨技术专家。

保证回答内容准确性。

本地或者网络检索。

多重评分回答问题严谨性。

二、网页茴香豆

 

这里面很多文章应该是超过长度限制了,报错了几次

huixiangdou/repodir/huixiangdou/resource/HuixiangDou.pdf---

huixiangdou/repodir/huixiangdou/docs/add_wechat_accessibility_zh.md--

huixiangdou/repodir/huixiangdou/docs/add_wechat_group_zh.md---

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/618538.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

1038: 顺序表中重复数据的删除

解法&#xff1a; #include<iostream> #include<vector> #include<algorithm> using namespace std; int main() {int n, k;cin >> n;vector<int> arr(n);for (auto& x : arr) cin >> x;cin >> k;int sum 0;for (auto x : arr…

(学习日记)2024.04.17:UCOSIII第四十五节:中断管理

写在前面&#xff1a; 由于时间的不足与学习的碎片化&#xff0c;写博客变得有些奢侈。 但是对于记录学习&#xff08;忘了以后能快速复习&#xff09;的渴望一天天变得强烈。 既然如此 不如以天为单位&#xff0c;以时间为顺序&#xff0c;仅仅将博客当做一个知识学习的目录&a…

平衡括号串:操作数和右括号需求数的维护过程

题目 如果知识判断合法括号&#xff0c;以及一个左括号对应一个右括号的最少插入次数&#xff0c;都是比较简单的。本题的难点在于&#xff1a;任何左括号"(“必须对应两个连续的右括号”)"。 题解 先写出题目的代码框架&#xff1a; def minInsertions(s: str) -…

【Linux】磁盘与文件系统管理

目录 一、 磁盘结构 1. 数据结构 2. 物理结构 3. 硬盘的接口类型 二、 如何使用Linux中的磁盘 三、 文件系统 四、 磁盘分区 1. MBR分区 2. 分区的优缺点 3. 磁盘及分区的管理工具 五、格式化与挂载 1. 格式化 2. 挂载 六、实例演示 1. 演示分区格式化挂载 2. …

吐血整理:大厂Python学习路线,从青铜到王者,从此打卡学习不迷茫

很多朋友都对成为技术大牛有着深深的向往 并有很多技术问题想要解决 因为市面上各种教程质量良莠不齐 而且想要掌握高阶的开发技术 需要耗费大量的时间和精力 现如今每天有数以百万计的人使用 Python &#xff0c;用户群呈现出指数级增长&#xff0c;几乎没有下降的趋势。 …

基于表面势的增强型p-GaN HEMT器件模型

来源&#xff1a;电子学报 22年 摘要 为了满足功率电路及系统设计对p-GaN HEMT&#xff08;High Electron Mobility Transistor&#xff09;器件模型的需求&#xff0c;本文建立了一套基于表面势计算方法的增强型p-GaN HEMT器件SPICE&#xff08;Simulation Program with Int…

spring-cloud-alibaba微服务Sentinel

Sentinel 官方网站 sentinel-dashboard-1.8.7.jar包下载地址 在window通过命令行启动&#xff08;java -Dserver.port8080 -Dproject.namesentinel-dashboard -jar sentinel-dashboard-1.8.7.jar&#xff09;&#xff0c;可以通过 -Dserver.port修改控制台的端口 使用的版本最好…

PostgreSQL入门到实战-第二十四弹

PostgreSQL入门到实战 PostgreSQL中表连接操作(八)官网地址PostgreSQL概述PostgreSQL中CROSS JOIN命令理论PostgreSQL中CROSS JOIN命令实战更新计划 PostgreSQL中表连接操作(八) 使用PostgreSQL CROSS JOIN从连接的表中生成行的笛卡尔乘积。 官网地址 声明: 由于操作系统, 版…

AI预测小分子与蛋白的相关特征: MegaMolBART, MoFlow,ESM-1, ESM-2

1、小分子:MegaMolBART, MoFlow 1)MegaMolBART https://github.com/NVIDIA/MegaMolBART 基于 SMILES 的小分子药物发现与化学信息学深度学习模型。 2)MoFlow https://github.com/calvin-zcx/moflow 用flow流方式分子生成 2、蛋白质:ESM-1, ESM-2 https://github.com/fa…

Java GUI制作双人对打游戏(下)

文章目录 前言一、动画是怎么实现的呢&#xff1f;二、根据这个原理 代码是怎么实现的呢&#xff1f;二、代码部分1.角色1&#xff08;左侧&#xff09;2.角色2&#xff08;右侧&#xff09;补充 最终的包结构效果图&#xff1a; 前言 接上篇&#xff1a;如何在IDEA中使用Java …

Web前端 Javascript笔记3

1、垃圾回收机制 内存中的生命周期 1、内存分配 2、内存使用&#xff08;读写&#xff09; 3、内存回收&#xff0c;使用完毕之后&#xff0c;垃圾回收器完成 内存泄漏&#xff1a;该回收的&#xff0c;由于某些未知因素&#xff0c;未释放&#xff0c;叫做内存泄漏 栈&#xf…

C# Window form 自定义控件的结构和设计(三)

C# Window form 自定义控件的结构和设计(三) 一、前面介绍了如何来创建第一个自定义的控件&#xff0c;以及一个测试程序。下面我们来看下如何在自定义控件中添加属性。 C#和其他.NET语言支持属性作为语言的第一类成员。把属性作为语言的基础属性有两点主要的有点&#xff1a…