RAG技术要点及英智未来的应用实践

news/2024/11/21 2:32:21/文章来源:https://www.cnblogs.com/ai2nv/p/18345639

 RAG是检索增强生成(Retrieval-augmented Generation),概念是在2020年发表的论文《面向知识密集型NLP任务的检索增强生成》中提出的。

LLM的工作原理是基于预训练的历史数据进行推理生成文本,所以LLM在生成回答的时候可能会引入了过期的、不可预测的或者错误的信息,导致大语言模型(LLM)在生成回答时可能产生的不准确或具误导性的输出,这种导致LLM生成毫无意义的或者错误的内容,称为AI幻觉。

RAG利用向量相似度检索技术搜索文档,然后组合成prompt喂给大模型,大模型再生成最终的答案,能有效的解决AI幻觉问题和知识更新等问题。

据调查统计,目前超过80%的落地应用基本都是RAG。

 

 RAG工作原理

做好RAG要经过数据提取、数据索引、检索、生成四个阶段,每个阶段都有不少难点。先用一张简单的图给大家看下RAG的过程:

1. 首先是数据提取

这一步的核心是要把各种结构化,非结构化数据能提取出来,用于后面的处理。这里的复杂度主要是:

  • 文件格式复杂,以pdf为例子,不光有文字,还夹杂有图表,图片里面又有文字。

  • 文件有上下文,要把上文相关的元信息提取出来,后面就更容易处理。如果不提取元信息,那下一步数据分块,就容易切分错误。

2. 其次数据索引

这一步做好文档的切分, embedding模型,把文件embedding成向量,才可以把向量存到向量数据库里面去。这里的难点又有两个:

  • 数据切分,过大、或过小都会有问题。所以一般是按照300~400个字节切分。还有处理更精细的,是按意图切分。

  • 另外就是embedding模型,文本类的有BGE、openAI的text-embedding-3;文图关联的有CLIP。现在这块的多模态模型是下一步重点。

3. 然后就是检索

检索主要分query预处理、召回两个步骤:

  • query预处理主要的步骤是意图识别、同义词生成、专有名词生成等。

  • 召回主要就是向量数据库的工作,要支持向量检索、文本检索、多路召回能力、召回之后重排技术。

4. 最后是生成阶段

检索出来的结果在给大模型之前,还要prompt优化,包括prompt加上step by step、针对场景的加上相应的提示词等。最后的结果依赖大模型的理解、生成、逻辑推理能力,大模型能力的强弱也直接决定RAG的效果。

RAG应用场景

  • 通用问答系统:RAG可以根据检索到的相关信息生成准确的答案,帮助员工更快地获取所需信息,提高决策效率,这些答案可能不直接包含在训练数据中,如公司规章制度、新员工入职培训、公司合同资料解读和查询等。

  • 智能客服系统:RAG可以结合产品资料知识库、聊天记录、用户反馈等数据,自动为用户提供更精准的回答。

  • 自动化文档处理:企业可以利用RAG和LLM自动化文档处理流程,例如自动生成合同、报告或策略文件,节省时间和人力成本。

  • 数据分析和处理:LLM和RAG可以结合外部数据源,如数据库、API、文件等,为数据处理和分析提供更丰富的信息。

     

RAG工作实践

英智「智能宝」是一款结合LLM+RAG技术的企业级AI智能体,通过私有化部署和分级权限管控确保信息安全边界、实时关联企业内部数据提供精准信息服务、面向企业业务场景深度定制办公助理智能体,助力企业打造AI时代的新质生产力!

优势一:数据安全边界

私有化部署,企业内部数据不出组织边界,有效防止企业隐私泄漏的风险。

优势二:分级权限管理

高度定制化的访问控制,分角色、分权限、分部门授权,企业内部员工之间也可做到数据隔离,确保内部敏感信息的安全。

优势三:内容关联性

在大模型的通用智能能力之上,结合经过授权的企业内部知识和实时数据,为企业员工提供更精准、更有针对性的信息。

优势四:场景化数字助理

深挖行业属性和应用场景,集成为AI智能体的能力,与企业员工协同工作,无缝衔接企业现有工作模式,提高工作效率和质量。

优势五:与ChatGPT同等智能水平

支持Llama3、Gemma、Qwen、Baichuan、GLM等业内主流大模型,采用领先的vLLM推理引擎,可插拔式更换大模型,确保智能水平和最前沿的AI技术保持同步。

英智AI智能体通过内置的高质量行业大模型,能够为企业结合自身数据快速创建定制化模型,满足企业特定商业场景需求,为教育、金融、法律等各行各业提供了大模型解决方案。比如:

  • 在教育行业,英智AI智能体可以辅助教师制作教学物料、协助教师优化教学方法、为学生定制个性化的学习路径、提供学生实时反馈与互动等;
  • 在金融行业,英智AI智能体可以为金融客户提供专业咨询服务、帮助投资人员分析投资决策、帮助金融机构提供风险评估预测、自动化生成分析报告等;
  • 在法律行业,英智AI智能体可以协助撰写各类专业的文书、帮助理解和分析案件等。

更多行业解决方案,请继续关注「英智未来」公众号。

免费体验,请访问:https://bonsai.baystoneai.com

添加“英智未来”好友,获取免费体验资格

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/778830.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024暑假集训测试18

前言比赛链接。这次有大量外校人员参加,\(90\) 来个人,T1 胡了个结论上去结果大小样例都过了,造 hack 还没 hack 了,索性交了,但是有捆绑感觉会爆零,没想到结论是对的,直接 A 了;打完 T1 就罚坐了,三个小时就弄出来 \(5\) 分,当时都绝望了,想到了很多东西。因为感觉…

智能加速计算卡设计原理图:628-基于VU3P的双路100G光纤加速计算卡 XCVU3P板卡

基于VU3P的双路100G光纤加速计算卡 一、板卡概述 基于Xilinx UltraScale+16 nm VU3P芯片方案基础上研发的一款双口100 G FPGA光纤以太网PCI-Express v3.0 x16智能加速计算卡,该智能卡拥有高吞吐量、低延时的网络处理能力以及辅助CPU进行网络功能卸载的能力,达到最大…

《数据资产管理核心技术与应用》读书笔记-第二章:元数据的采集与存储

《数据资产管理核心技术与应用》是清华大学出版社出版的一本图书,全书共分10章,第1章主要让读者认识数据资产,了解数据资产相关的基础概念,以及数据资产的发展情况。第2~8章主要介绍大数据时代数据资产管理所涉及的核心技术,内容包括元数据的采集与存储、数据血缘、数据质…

SchurVINS

SchurVINS: Schur Complement-Based Lightweight Visual Inertial Navigation System SchurVINS:基于Schur补的轻量级视觉惯性导航系统 Yunfei Fan, Tianyu Zhao, Guidong Wang 范云飞,赵天宇,王朝栋 ByteDance 字节跳动 {frank.01, zhaotianyu.1998, guidong.wang}@byteda…

帝国cms里栏目列表模板获取同级栏目的方法

帝国cms里栏目列表模板获取同级栏目的方法 [showclasstemp]$class_r[$GLOBALS[navclassid]][bclassid],3,0,0[/showclasstemp] 必须要先获取到当前栏目的父栏目ID 页面模板内容支持的变量下有 [!--bclass.id--] 但是这个不能在标签里使用 所以采用php代码来获取 $GLOBALS[navcl…

织梦DEDECMS怎么增加自定义属性

使用phpmyadmin方式添加自定义属性的方法步骤: 1、更改数据库前,先备份数据库,以免更改失败时,可以恢复到更改前的状态。 2、用phpmyadmin更改数据库比较直观,方便新手直接看到更改状况,所以建议新手使用这种方法。 3、进入phpmyadmin,打开dede_archives,点击“结构”,…

织梦dede怎么修改关键字长度?

dede文件修改默认关键字长度 第1步:找到并打开dede后台目录下的article_edit.php和article_add.php文件。 电脑维修技术网注:如果是修改专题认关键字的话,需要修改spec_add.php和spec_edit.php文件。 第2步:在文件中搜索"keywords",找到“$keywords = trim(cn_s…

织梦dedecms怎么更换模板

更换 Dedecms 模板是一个相对简单的过程,本指南将详细介绍如何操作。 步骤下载模板从 Dedecms 官方网站或其他可信来源下载所需的模板。上传模板解压缩下载的模板文件,并将所有文件上传到 Dedecms 安装目录中的 "templets" 文件夹。管理模板登录 Dedecms 后台,进入…

帝国cms首页栏目是网站首页最醒目的特殊栏目

帝国cms首页栏目是网站首页最醒目的特殊栏目,用于展示网站重要信息,内容丰富且可定制,其作用包括:展示核心内容、提升用户体验和提升品牌形象。如何设置:登录后台,选择“栏目管理”,点击“添加栏目”,输入“栏目名称”(首页)、“单页地址”(index),设置其他选项,…

dedecms前台文件在templets\default路径下

正常的在服务器或者ftp里面看的话应该是: 根目录-》templets-》default-》head.html 就可以了,然后用Dreamweaver或者记事本打开就可以了。扫码添加技术【解决问题】专注中小企业网站建设、网站安全12年。熟悉各种CMS,精通PHP+MYSQL、HTML5、CSS3、Javascript等。承接:企业…

【数值计算方法】线性方程组的迭代解法

介绍线性方程组的迭代解法,包括:雅可比迭代法,GS迭代法,SOR迭代法等等目录第6章 线性方程组的迭代解法1. 范数和条件数1.1 向量和矩阵的范数1.2 条件数和扰动分析2. 基本迭代法2.1 迭代法基本思路2.2 雅可比迭代法2.3 高斯–赛德尔迭代法2.4 超松弛 (SOR) 迭代法 第6章 线性…