dify知识库

news/2025/3/20 15:47:14/文章来源:https://www.cnblogs.com/xiao987334176/p/18781110

一、概述

知识库功能将 RAG 管线上的各环节可视化,提供了一套简单易用的用户界面来方便应用构建者管理个人或者团队的知识库,并能够快速集成至 AI 应用中。

开发者可以将企业内部文档、FAQ、规范信息等内容上传至知识库进行结构化处理,供后续 LLM 查询。

相比于 AI 大模型内置的静态预训练数据,知识库中的内容能够实时更新,确保 LLM 可以访问到最新的信息,避免因信息过时或遗漏而产生的问题。

LLM 接收到用户的问题后,将首先基于关键词在知识库内检索内容。知识库将根据关键词,召回相关度排名较高的内容区块,向 LLM 提供关键上下文以辅助其生成更加精准的回答。

开发者可以通过此方式确保 LLM 不仅仅依赖于训练数据中的知识,还能够处理来自实时文档和数据库的动态数据,从而提高回答的准确性和相关性。

核心优势:

实时性:知识库中的数据可随时更新,确保模型获得最新的上下文。

精准性:通过检索相关文档,LLM 能够基于实际内容生成高质量的回答,减少幻觉现象。

灵活性:开发者可自定义知识库内容,根据实际需求调整知识的覆盖范围。

 

官方文档:https://docs.dify.ai/zh-hans/guides/knowledge-base

 

二、创建知识库

 准备一个excel文件,半期考试成绩.xlsx,内容如下:

 

登录dify,点击知识库,创建知识库,上传文件

分段设置,选择通用

索引方式,默认是高质量,点击预览块

 右上角会出现报错:PluginDaemoninternalServerError: noavailable node, plugin not found

这个是1.1.0版本的bug

 

解决方案:

点击插件-->探索Marketplace,搜索Lark,安装全部包含Lark的插件,安装完成后,重启dify即可。

 

 再次上传excel文件

点击预览快,就可以看到excel的数据了

 

最后点击保存并处理

 

 提示嵌入完成

 

 进入知识库,查看文件状态是正常的。

 

 点击召唤测试,可以看到对应的段落,结果不是最准确的。因为这些结果,都包含了语文。

 

三、使用知识库

 新建聊天工作流test-chat

 创建完成后,默认是这样的

 删除中间的LLM节点,右键删除

添加条件分支,sys.query包含知识库。 也就是聊天信息包含知识库关键字

 添加知识库检索,添加知识库,半期考试成绩

 添加LLM,进行分析总结

选择模型,qwen-max-laster

上下文,选择知识库,result对象

SYSTEM,这里写提示词。

注意:sys.query是变量, 上下文也是变量。 点击右边的{x}就可以手动选择变量了

 添加直接回复

 

如果不包含知识库关键字,则直接AI回答,添加LLM

 最后添加直接回复,完整流程如下:

 最后发布,运行

 

查询知识库

 查询非知识库

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/902050.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

DevOps 平台选型对比:功能与价值剖析

在数字化转型加速的当下,高效的软件开发流程成为企业竞争力的关键。DevOps 平台作为整合开发与运维的重要工具,其选型至关重要。Gitee DevOps 是一款在行业内表现出色的平台,能为企业提供从代码管理到部署上线的全流程支持。通过对其功能、价格、用户体验等多方面与市场竞品…

关于如何搭建anythingllm+ollama(deepseekr1、嵌入模型)+milvus的本地知识库语言模型

这里只是对于自己在部署过程中踩到的坑做个记录。 以anythingllm为平台,接入基于ollama运行deepseekr1通用模型、嵌入模型,使用milvus作为向量数据库。其中milvus和anythingllm均在docker desktop中运行。 一、ollama 1.首先在ollama官网下载并安装ollama。 2.然后在官网的mo…

Endnote 修改了参考文献格式后,文献的引用有的上标,有的不是上标

如上图,有的文献引用是正常格式,有的文献引用的的方括号是上标的形式。解决如下: 打开Endnote,找到“编辑”---“输出样式”---“编辑XXXXXX”(XXXXXX表示你正在使用的参考文献格式)---“引用”---“模板”---“Citatian” 将方框中的“Bibliography Number”两边的方括号…

Explain查询Sql效率

Explain分析Sql性能 前言 在我们平时开发中,因为系统可能属于初级阶段,数据库的数据还不是很多,所以自我感觉写的Sql语句上运行起来速度还不错,殊不知,随着时间推移,数据量日益增多,系统的查询效率会在打折扣,所以,Sql性能调优手段还得了解一下下。 Explain是什么?有…

部署mall项目遇到的问题和解决方案

部署mall项目爬坑日记 原作者项目 环境:ubuntu20 docker容器相关的坑 发现容器打印的日志和当前时间有出入,相差了8小时,后面得知容器和宿主机的时区不同导致 !> 解决办法有如下几种:1.在刚开始创建容器的时候,docker run后面加上-v /etc/localtime:/etc/localtime:ro2…

高并发下如何保证幂等性

好文章怕丢失?码起来! 本文转载自原文 高并发下如何保证接口的幂等性? 接口幂等性问题,对于开发人员来说,是一个跟语言无关的公共问题。本文分享了一些解决这类问题非常实用的办法,绝大部分内容我在项目中实践过的,给有需要的小伙伴一个参考。 不知道你有没有遇到过这些场…

考OCP认证要交哪些费用?

考OCP认证要交哪些费用? 考OCP认证,指的是Oracle数据库管理员中级认证 Oracle Certified Professional,这是Oracle非常有名的一个认证,对于个人帮助巨大。 OCP认证要交不少钱,些费用因考试版本、培训机构和地区差异而有所不同,以下是综合各渠道信息后的费用说明: 1. 考…

JDK 24 发布,新特性解读!

真快啊!Java 24 这两天已经正式发布啦!这是自 Java 21 以来的第三个非长期支持版本,和 Java 22、Java 23一样。 下一个长期支持版是 Java 25,预计今年 9 月份发布。 Java 24 带来的新特性还是蛮多的,一共 24 个。Java 23 和 Java 23 都只有 12 个,Java 24的新特性相当于这…

解锁实时跌倒检测Jetson Nano与定制的YOLOv8

1. 概述 跌倒是一个重大问题,特别是对老年人和有疾病的人来说,因为它们可能导致严重伤害甚至死亡。坠落探测系统旨在迅速识别此类事件,确保及时提供援助并减少造成严重后果的风险。随着人工智能和机器学习的进步,跌倒检测变得更加准确和可靠。在我之前的博客中,“开始使用…

请求接口,接口响应中带回cookie,再请求其他接口后,cookie没有自动带入

最近做的项目,登陆时内部的登录,做个跳转,在那边登陆后会回跳到本地页面 本地联调接口,回调地址一直是提示跨域,然后再访问其他的接口提示401,未认证状态 从这个大哥中看到的问题,感谢 http://www.janron.net/details/8-computerLanguage-2326-488首先确定后端的接口resp…

Glyphs制作tff字体子集

官网 https://glyphsapp.com/zh 导出字体的子集 开发过程中整个字体文件太大,需要制作部分字体的子集合。 双击tff文件打开字体文件选择要保留的字符 •进入字体编辑窗口后,你会看到所有字符的网格。 •按住 Cmd 键并点击你想要保留的字符。 例如:大小写字母、数字、特殊符号…

开启MySQL8的密码策略组件validate_password.250320

一、validate_password组件安装配置安装组件INSTALL COMPONENT file://component_validate_password;安装后,密码策略立即生效,但仅影响后续操作(如新建用户或修改密码)。卸载组件UNINSTALL COMPONENT file://component_validate_password;卸载后,密码复杂度策略失效,可设…