基于阿里云向量检索 Milvus 版与 PAI 搭建高效的检索增强生成(RAG)系统

阿里云向量检索 Milvus 版现已无缝集成于阿里云 PAI 平台,一站式赋能用户构建高性能的检索增强生成(RAG)系统。您可以利用 Milvus 作为向量数据的实时存储与检索核心,高效结合 PAI 和 LangChain 技术栈,实现从理论到实践的快速转化,搭建起功能强大的 RAG 解决方案。

​​免费试用​​

背景信息

随着 AI 技术的飞速发展,生成式人工智能在文本生成、图像生成等领域展现出了令人瞩目的成就。然而,在广泛应用大语言模型(LLM)的过程中,一些固有局限性逐渐显现:

  • 领域知识局限:大语言模型通常基于大规模通用数据集训练而成,这意味着它们在处理专业垂直领域的具体应用时可能缺乏针对性和深度。
  • 信息更新滞后:由于模型训练所依赖的数据集具有静态特性,大模型无法实时获取和学习最新的信息与知识进展。
  • 模型误导性输出:受制于数据偏差、模型内在缺陷等因素,大语言模型有时会出现看似合理实则错误的输出,即所谓的“大模型幻觉”。

为克服这些挑战,并进一步强化大模型的功能性和准确性,检索增强生成技术 RAG(Retrieval-Augmented Generation)应运而生。这一技术通过整合外部知识库,能够显著减少大模型虚构的问题,并提升其获取及应用最新知识的能力,从而实现更个性化和精准化的 LLM 定制。

RAG 技术架构的核心为检索和生成。其中,检索部分采用了高效的向量检索引擎和向量数据库技术,例如基于开源库 Faiss、Annoy 以及 HNSW 算法优化构建的 Milvus 系统,极大地提升了对大规模数据进行快速检索和精确分析的能力。这样的设计使得RAG能够在必要时即时调用相关领域或最新信息,有效弥补了传统大语言模型的不足之处。

前提条件

  • 已创建 Milvus 实例,并配置了公网访问。具体操作请参见​​快速创建Milvus实例​​和​​网络访问与安全设置​​。
  • 已开通 PAI(EAS)并创建了默认工作空间。具体操作,请参见​​开通PAI并创建默认工作空间​​。

使用限制

Milvus 实例和 PAI(EAS)须在相同地域下。

操作流程

步骤一:通过 PAI 部署 RAG 系统

1.进入模型在线服务 EAS

        a.登录 ​​PAI控制台​​。

        b.在左上角顶部菜单栏选择目标地域。

        c.在左侧导航栏选择模型部署>模型在线服务(EAS),在下拉框中选择目标工作空间后单击进入EAS

2.在 PAI-EAS 模型在线服务页面,单击部署服务

3.在部署服务页面,选择大模型RAG对话系统

4.在部署大模型RAG对话系统页面,配置以下关键参数,其余参数可使用默认配置,更多参数详情请参见​​大模型RAG对话系统​​。

参数

描述

基本信息

服务名称

您可以自定义。

模型来源

使用默认的开源公共模型

资源配置

模型类别

通常选择通义千问7B。例如,Qwen1.5-7b。

资源配置选择

按需选择GPU资源配置。例如,ml.gu7i.c16m30.1-gu30。

向量检索库设置

版本类型

选择Milvus

数据库文件夹名称

您在Milvus中自定义的Collection名称。

访问地址

Milvus实例的内网地址。您可以在Milvus实例的实例详情页面查看。

代理端口

Milvus实例的Proxy Port。您可以在Milvus实例的实例详情页面查看。

账号

配置为root。

密码

配置为创建Milvus实例时,您自定义的root用户的密码。

Collection删除

是否删除已存在的Collection。取值如下:

  • True:删除同名的Collection,再创建新的Collection。如果不存在同名Collection,则直接进行创建。
  • False:保留现有的同名Collection,新加入的数据将追加到该Collection中。

专有网络配置

VPC

创建Milvus实例选择时的VPC、交换机和安全组。您可以在Milvus实例的实例详情页面查看。

交换机

安全组名称

5.单机部署
服务状态变为运行中时,表示服务部署成功。

6.在模型在线服务(EAS)页面,单击查看Web应用,进入WebUI页面。

步骤二:在 WebUI 中使用 Milvus 向量检索

1.测试连通性。如下图所示,在 RAG 服务 WebUI 界面的 Settings 选项卡中,系统已自动识别并应用了部署服务时配置的向量检索库设置,并且该设置不支持修改。您可以单击 Connect Milvus,来验证 Milvus 连接是否正常。


连接正常后 Connection Info 显示 Connect Milvus success。

2.上传数据。如下图所示,您可以在 RAG 服务 WebUI 界面的 Upload 选项卡中,上传 TXT 或 HTML 类型的用户知识库文档。本文以​​​PAI.txt​​​例,当完成上传后,会显示​​Upload 1 files [ PAI.txt, ] Success! ​​​。


您还可以在 Milvus 实例的实例详情页,单击右上角的 Attu Manager,然后输入 Milvus 实例的用户名和密码,可以查看写入的数据和向量等信息。Attu 的相关操作,请参见 ​​Attu操作指南​​。

3.向量检索。如下图所示,您可以在 RAG 服务 WebUI 界面的 Chat 选项卡中,选择 RAG (Retrieval + LLM),然后进行向量检索等一系列实验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/698531.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

哪个品牌led灯好?五大好用护眼台灯推荐

哪个品牌led灯好?目前LED护眼台灯当中做得比较好的有明基、松下、书客等品牌。在如今LED灯市场的海洋中,选择一款可靠的护眼台灯变得愈发重要。然而,众多品牌和产品的涌现也让消费者面临着选择困难。为了帮助大家找到最合适的LED台灯&#xf…

Java面试八股之String s = “String“;和String s = new String(“String“);有什么区别

Java中String s "String";和String s new String("String");有什么区别 字符串字面量("String"): 常量池:使用字面量方式创建字符串时,Java虚拟机(JVM)会在运…

leetcode-最长公共前缀-105

题目要求 思路 1.先将字符串数组进行排序,排序后的第一个元素的长度,就是最长公共前缀可能的最大长度,后续只需要比较这一段字符串的最大公共前缀即可。 2.将每一个字符串固定下标值的字符同第一个字符串所对应的对应字符进行对比&#xff…

学习古琴律学的好东西,帮您从基因里学古琴

《从基因里学懂古琴》是一本关于古琴律学的著作,作者通过基因的角度来解读古琴音乐的奥秘和美妙。古琴作为我国传统文化的瑰宝之一,具有悠久的历史和独特的音乐风格,但其律学原理一直以来都是一个谜。本书从基因的角度探讨了古琴音乐的律学特…

什么是.faust勒索病毒?应该如何防御?

faust勒索病毒详细介绍 faust勒索病毒是一种新型的勒索软件,最早出现在2018年。该病毒通过加密计算机系统中的文件并要求支付赎金来解锁文件,从而获取经济利益。与传统的勒索软件相比,faust勒索病毒采用了更加先进的加密算法和隐藏技术&#…

戒烟网站|基于SSM+vue的戒烟网站系统的设计与实现(源码+数据库+文档)

戒烟网站 目录 基于SSM+vue的戒烟网站系统的设计与实现 一、前言 二、系统设计 三、系统功能设计 1网站功能模块 2管理员功能模块 3用户功能模块 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取: 博主…

ARIMA预测模型介绍

ARIMA(Autoregressive Integrated Moving Average)模型是一种常用的时间序列分析方法,能够对非平稳时间序列进行建模和预测。本文将详细介绍ARIMA模型的建模步骤,包括数据预处理、模型识别、参数估计和模型检验等环节,…

Unable to start ServletWebServerApplicationContext due to missing ServletWeb

这个错误信息通常表示在启动 Java 项目时,Spring Boot 应用程序无法找到或启动嵌入式的 Servlet 容器(例如 Tomcat、Jetty 等)。这可能是由于项目的依赖项配置有问题。以下是一些常见的解决方法: 检查依赖项: 确保你的…

对关系型数据库管理系统的介绍

1.数据库的相关介绍 关系型数据库管理系统:(英文简称:RDBMS) 为我们提供了一种存储数据的特定格式,所谓的数据格式就是表, 在数据库中一张表就称为是一种关系. 在关系型数据库中表由两部分组成&#xf…

美港通正规股票杠杆交易突破3900点,欧线集运再创历史新高

查查配5月13日,欧线集运主连高开高走,盘中一度涨超13%,截至早盘收盘涨11.93%,突破3900点。4月以来,欧线集运主连累计涨超110%。 美港通证券以其专业的服务和较低的管理费用在市场中受到不少关注。该平台提供了实盘交易、止盈止损、仓位控制等功能,旨在为投资者提供更为全面的投…

SAP-QM-检验批后续处理操作

1、前提数据订单 1.1、创建订单 1.2、收货MIGO 上图是第一种收货103,如果是这种收货是不能转移库存的QAC2,会报下面的错误 修改过账数量QAC3 报错 关于移动类型的使用控制还没研究,有大神可以指点12.如果说没有这个控制,数量修改是可以的。 下图是用101收货到质检仓,继续…

刚刚OpenAI发布ChatGPT-4o模型,免费使用GPT4o并免费提供更多功能

就在今日凌晨1点,OpenAI举行了春季发布会,发布了GPT-4o 并免费提供更多功能。 亲测GPT-4o已经可以免费试用,每个人都可以使用它并从中受益,GPT4终于不再是少部分人的玩物。 点击加入ChatGPT4交流群:https://www.aijour…