引爆知识革命!Easysearch 携手 DeepSeek 打造下一代智能问答系统

news/2025/2/22 22:46:46/文章来源:https://www.cnblogs.com/infinilabs/p/18719203

去年我们尝试过使用 Easysearch + 千问 2 大模型打造一个企业内部知识问答系统,今年又有更加给力的大模型出现了--DeepSeek,性能对标 OpenAI o1 正式版。而且 Easysearch 对比去年也有了不少进步,是时候让我们升级下问答系统了。

DeepSeek

2025 年 1 月 20 日,人工智能领域迎来里程碑式突破!深度求索(DeepSeek)正式发布新一代推理大模型 DeepSeek-R1,不仅实现与 OpenAI 最新 o1 正式版的性能对标,更以全栈开放的生态布局引发行业震动。DeepSeek-R1 是首个遵循 MIT License 开源协议的高性能推理模型,完全开源,不限制商用,无需申请,极大地推动了 AI 技术的开放与共享。

下载模型

我们使用 ollama 下载运行 DeepSeek-R1,根据本地资源情况选择一个大小合适的版本:8b。

  • 8b 蒸馏模型源自 Llama3.1-8B-Base
  • 7b 蒸馏模型源自 Qwen-2.5 系列

这两个可能是个人用户使用最多的选择,大家资源充足的可以都下载下来对比下效果。

由于是升级,我们只需在原有程序基础上替换新版本的 Easysearch 和集成 DeepSeek 即可,Easysearch 升级成新版本 1.10.1,程序框架和 embedding 模型 (mxbai-embed-large:latest) 仍然保持不变。

数据准备

跟上次一样,使用 "INFINI 产品安装手册.PDF" 作为知识内容,通过程序将文档内容切片、转换成向量后写入 Easysearch 存储,然后结合大模型对其中的内容进行提问。

程序调整

程序代码需要调整 LLM 为 deepseek-r1:8b。另外本地主机资源有限,为节约时间,取消上个版本的用户问题改写功能(注释部分)。定义新的 retriever 和 qa_chain 直接将用户问题和 context 信息发送给大模型。

# # 实例化一个大模型工具
from langchain_community.chat_models import ChatOllamallm = ChatOllama(model="deepseek-r1:8b")# from langchain.prompts import PromptTemplate# my_template = PromptTemplate(
#     input_variables=["question"],
#     template="""You are an AI language model assistant. Your task is
#     to generate 3 different versions of the given user
#     question in Chinese to retrieve relevant documents from a vector  database.
#     By generating multiple perspectives on the user question,
#     your goal is to help the user overcome some of the limitations
#     of distance-based similarity search. Provide these alternative
#     questions separated by newlines. Original question: {question}""",
# )# 实例化一个MultiQueryRetriever
# retriever_from_llm = MultiQueryRetriever.from_llm(
#     retriever=docsearch.as_retriever(),
#     llm=llm,
#     prompt=my_template,
#     include_original=True)retriever = docsearch.as_retriever()
# 实例化一个RetrievalQA链
qa_chain = RetrievalQA.from_chain_type(llm, retriever=retriever)

至此程序修改已经完成,原程序算上注释也不过 100 来行,大家感兴趣的可以去查看原博客。

效果测试

模拟用户提问:网关运行后监听哪个端口。

系统回答如下。

在回答中,可以看到 DeepSeek 的"思考"过程,另外回答结果也非常正确,文档中原文还是用的英语 INFINI Gateway 表示网关。

模拟用户提问:LOGGING_ES_ENDPOINT 有什么用。

系统回答如下。

文档原文内容如下。

好了,我对 DeepSeek 的表现很满意,至此知识问答系统就升级完了。

如有任何问题,请随时联系我,期待与您交流!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/884941.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

人体碘元素知识

碘(化学符号:I,原子序数:53),碘是一种深紫色的固体,在常温常压下呈片状晶体。它具有较强的挥发性,当受热时,固体碘会直接转变为紫色的气体.在水中,碘不溶解,但可以溶解于一些有机溶剂中,例如乙醇和二甲苯。碘具有氧化性,在一些反应中可以作为氧化剂,例如氧化亚硫酸…

2025-02-16-snipd-format-for-obsidian

[!NOTE] This is a very early version, if something help, I would maintain it.Repo Meta<center>via: <a href=https://www.youtube.com/watch?v=bB-VWtidB5E target=_blank class=external-link>https://www.youtube.com/watch?v=bB-VWtidB5E</a><…

ingress生产环境安装方法

[!NOTE] 下载的Nginx Controller helm chart版本必须跟当前k8s版本兼容 官方参考地址:https://github.com/kubernetes/ingress-nginx/Supported Versions tableSupported Ingress-NGINX version k8s supported version Alpine Version Nginx Version Helm Chart Version🔄 v…

JUC并发-4.wait和notify以及Atomic原理

大纲 1.wait()与notify()实现一个简易的内存队列 2.wait()与notify()的底层原理 3.分布式存储系统NameNode机制介绍 4.分布式存储系统的edits log机制介绍 5.分布式存储系统的NameNode实现 6.分布式存储系统的创建目录功能的实现 7.edits log的全局txid机制和双缓冲机制实现 8.…

ACM寒假集训第六次专题任务

ACM寒假集训第六次专题任务 一、最大子段和 题目:解题思路: 维护两个变量:b 表示以当前元素结尾的最大子数组和,ans 表示全局的最大子数组和。遍历数组时,对于每个元素,更新 b 为当前元素值或当前元素与前一个最大子数组和的和(取较大值),同时更新 ans 为全局最大值。…

LGP9607 [CERC 2019] Be Geeks! 学习笔记

LGP9607 [CERC 2019] Be Geeks! 学习笔记 Luogu Link 题意简述 给定一个长为 \(n\) 的序列 \(A\)。 定义 \(G(l,r)=\gcd(a_l,a_{l+1}\cdots a_r)\); 定义 \(M(l,r)=\max(a_l,a_{l+1}\cdots a_r)\); 定义 \(P(l,r)=G(l,r)\times M(l,r)\); 计算 \(\sum P(i,j)[1\le i\le j\le…

卷积,toeplitz矩阵与傅里叶变换FT

卷积,toeplitz矩阵与傅里叶变换FT相关与卷积 一维相关和卷积运算是两个向量共同作用得到一个新的向量。 相关的分量形式: \[\begin{aligned} 映射(f: \mathbb{Z} \to \mathbb{R}),对于(w = (w(-a), \ldots, w(0), \ldots, w(a))), \\ 一维相关: g(x) = \sum_{s = -a}^{a}…

记录一次修复 JetBrains Rider 控制台输出乱码

在使用 JetBrains Rider 调试程序时,控制台输出日志出现了乱码。歪打正着结果困扰许久的问题得到了解决,于是记录下了这个小短文。 具体的修复建议如下:将终端编码设置为 GB2312 具体操作:设置->编辑器->常规->控制台->设置为 GB2312 ->保存之前在网上找各…

联合体union

占用大小按字节数最大的变量来,下面的联合体的大小为4字节typedef union MyUnion {char c; //1byteint i; //4byte } _MyUnion; int main() {_MyUnion v;printf("%x, %x\n", v.c, v.i); //未初始化时的值printf("%x, %x, %x, %x\n", &v, &v.c, &a…

使用docker搭建php开发环境

本文年代久远,可能已经不适用。仅供参考! 新的php镜像参考 多容器 apache+php+mariadb+redis主要配置 构建php镜像 基于官方php镜像进行定制,增加所需的php扩展,修改php配置,以及创建虚拟主机。 Dockerfile 文件php/Dockerfile FROM php:apache# php configure COPY php.i…

基于SVPWM矢量控制的无速度传感器电机控制系统simulink建模与仿真

1.课题概述基于SVPWM矢量控制的无速度传感器电机控制系统simulink建模与仿真,包括电机,SVPWM模块,矢量控制器模块等。2.系统仿真结果3.核心程序与模型 版本:MATLAB2022a 4.系统原理简介基于空间电压矢量控制(Space Vector PWM,SVPWM)的无速度传感器电机控制系统,特别是…

如何为 .NET 在线客服系统的 Open Api 开放接口实现 QPS 限流功能

在 .NET 中实现 QPS 限流有很多方案,对于小流量的应用,内存限流和基于中间件的限流方式可能已经足够,而对于高并发的分布式系统,可能需要 Redis 或者更复杂的算法,如令牌桶或滑动窗口。我在业余时间开发了一款自己的独立产品:升讯威在线客服与营销系统。陆陆续续开发了几…