为DeepSeek添加本地知识库-编程知识

为DeepSeek添加本地知识库

news/2025/2/21 9:36:12/文章来源:https://www.cnblogs.com/aser1989/p/18723717

为什么要尝试给DeepSeek添加本地知识库呢？作为一个程序员，以前也用过很多AI产品，直到春节DeepSeek爆火，成功在自己的电脑上把AI模型跑起来的时候才真正感受到AI已近在咫尺。未来很多应用和项目都离不开这个工具。或许在我们OA系统中会出现一个AI小助手，我们会问它差旅费报销流程怎么走、合同流程怎么走、负责某某业务的同事的联系方式等等。当然，这应该是最简单的应用场景。时代变了！以前需要找好多个部门的专业人士了解的信息，未来用AI工具就能快速获取，并且是提炼总结后的内容。要实现这些功能，必然需要提供相关的资料内容，这就得有一个知识库。对于知识库的搭建目前已有很多的方案，接下来介绍下自己的体验过程。

工具介绍

AnythingLLM

我主要学习的是anythingLLM这个工具，且抄一段官方介绍吧：AnythingLLM是一个全栈应用程序，您可以使用现成的商业大语言模型或流行的开源大语言模型，再结合向量数据库解决方案构建一个私有ChatGPT，不再受制于人：您可以本地运行，也可以远程托管，并能够与您提供的任何文档智能聊天。AnythingLLM将您的文档划分为称为workspaces (工作区)的对象。工作区的功能类似于线程，同时增加了文档的容器化。工作区可以共享文档，但工作区之间的内容不会互相干扰或污染，因此您可以保持每个工作区的上下文清晰。
以上是官方提供的中文介绍，查看原文请点击这里。AnythingLLM在它的官网上下载对应的系统版本安装即可。表面上看它是一个桌面应用程序，实际是可以部署到自己服务器上作为一个BS应用来使用。

Ollama
AnythingLLM支持多种大语言模型，因为前一段时间在本地安装了Ollama部署了deepseek R1的14b版本，所以就不折腾了，相关的内容可以看看我之前的分享（内容传送门,一定记得回来）。

完整过程

打开AnythingLLM，左边是工作区列表，右边则是对话窗口。知识库的应用是以工作区为维度进行的，要创建本地知识库就需要先创建一个工作区，点击右侧“+新工作区”按钮，输入工作区名称，工作区的创建就完成了，主分享一下工作区设置。在新建的工作区右侧有一个设置按钮（齿轮），然后进入到如下界面：

补一下坑：在启动AnythingLLM前，先完成Ollama的安装启动，并且运行自己喜欢的模型，否则AnythingLLM工作区配置上无法自动读取到聊天模型列表。配置完成后一定记得点一下保存按钮。

接下来就是知识投喂了，也就是怎么向知识库中添加资料。AnythingLLM的资料管理主要有两个途径：一是上传相关的文档，主要支持文本文件、csv以及音频文件等；二是直接添加URL。资料上传的入口在工作区右侧有一个上传按钮，点击后会出现资料管理的界面：

资料添加后还需要移动到工作区

点击保存并嵌入

还没完，下图中的图钉按钮要点一下。

然后就可以开始聊天了。点击工作区下方的聊天记录或“New Thread”按钮，在右侧的对话框中输入我们的需求来进行验证。
我先测试了一下PDF内容查询，由于电脑配置比较低，14b有点卡，切换到1.5b试了试，效果居然还可以！结果如下：

再测试了一下网页内容,确实能读取到相关信息，上传的URL是npm上我自己的一个package，它不仅能做介绍、抄示例代码，居然还添油加醋的讲了一段：

至此简单的本地知识库体验就完成了，虽然这还达不到真正投入使用要求，但也许未来我们可以用这种方式做一个团队知识管理工具，将公司技术沉淀与AI代码编码能力相结合。

最后

知识库能解决很多日常的相关基础应用需求，更深层次的应用还需要努力学习和思考，本地实验的目的在于通过学习相关知识更好的去认识和理解AI技术。好在，出于自身后知后觉的特性，能在网上找到丰富的学习资料，在学习的过程中我会不断的记录，不断的矫正。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/886725.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

SciTech-EECS-Circuits-Digital(数字电路): Latch(锁存器) + Flip/Flop(触发器) + 记忆存储电路

SciTech-EECS-Circuits-Digital(数字电路): Latch(锁存器) + Flip/Flop(触发器) + 记忆存储电路

SciTech-EECS-Circuits-Digital(数字电路) Latch(锁存器)Flip/Flop(触发器)记忆存储电路

阅读更多...

山石网科阿里云通义灵码，开启研发“AI智造”新时代

山石网科阿里云通义灵码，开启研发“AI智造”新时代

近日，山石网科正式宣布全面接入阿里云通义灵码企业专属版，这标志着山石网科在研发智能化、自动化领域迈出重要一步，为研发工作注入强大的AI动力，实现多维度的效率飞跃。近日，山石网科正式宣布全面接入阿里云通义灵码企业专属版，这标志着山石网科在研发智能化、自动化领域…

阅读更多...

frame/tab 切换，一些技巧

frame/tab 切换，一些技巧

点击这里，边看视频讲解，边学习以下内容 frame切换请大家点击这里，打开这个链接如果我们要选择下图方框中所有的蔬菜，使用css选择，怎么写表达式？当然，要先查看到它们的html元素特征大家可能会照旧写出如下代码：from playwright.sync_api import sync_playwrightp…

阅读更多...

CSS选择器定位方法

CSS选择器定位方法

定位元素的重要性前面这段代码from playwright.sync_api import sync_playwrightp = sync_playwright().start() browser = p.chromium.launch(headless=False) page = browser.new_page() page.goto("https://www.byhy.net/cdn2/files/selenium/stock1.html")# 输入…

阅读更多...

Arduino-Esp8266 OTA升级

Arduino-Esp8266 OTA升级

#include <ESP8266WiFi.h> #include <ESP8266httpUpdate.h> #include <Ticker.h>/******需要修改的地方****************/#define wifi_name "GT-2G" //WIFI名称，区分大小写，不要写错 #define wifi_password "gt#@10000" …

阅读更多...

汽车落水自救措施

汽车落水自救措施

阅读更多...

【IDEA】idea接入AutoDev插件并配置DeepSeek

【IDEA】idea接入AutoDev插件并配置DeepSeek

1. AutoDev Quick Start https://ide.unitmesh.cc/quick-start2. AutoDev 下载 https://github.com/unit-mesh/auto-dev/releases3. 根据IDEA版本进行下载比如我的IDEA版本是2024.3.2.1 那么我应该下载的就是241.zip 需要根据最新的quick-start去release下载对应版本 4. IDEA…

阅读更多...

CF559E Gerald and Path 题解

CF559E Gerald and Path 题解

CF559E Gerald and Path 很困难的 DP 题，状态不是很好想。对于这种线段覆盖类题目，显然先覆盖哪个线段没有影响，我们可以通过按照端点位置升序排序后按照顺序考虑，这样可能会有一些额外性质。之后，考虑转移时需要什么东西来刻画一个状态的轮廓。显然我们需要知道现在是第…

阅读更多...

中国PostgreSQL数据库认证体系和学习方向

中国PostgreSQL数据库认证体系和学习方向

中国PostgreSQL数据库认证体系和学习方向PostgreSQL认证，指的是PostgreSQL数据库管理员的能力认证，用来判断从业人员是否具备管理和维护PostgreSQL数据库的能力，由于数据库中存放着很多重要的数据，所以对于从业人员的要求极高，所以企业在招聘相关岗位的时候，会优先考虑有…

阅读更多...

ATTCK实战系列（一）

ATTCK实战系列（一）

环境下载下载靶场环境，并导入虚拟机分别是win2003、win7、winserver2008配置网络虚拟机——编辑——虚拟机网络编辑器——添加网络VMnet2——仅主机模式分配的地址是192.168.52.0配置好地址后，需要将win2003和winserver2008的网卡设置为VMnet2win7的网络需要两张，一张为VM…

阅读更多...

DHTMLX Gantt 甘特图导出全数据图/PDF

DHTMLX Gantt 甘特图导出全数据图/PDF

最近有个需求，将项目甘特图导出图片，但发现问题：当项目甘特图内的行数很多时（这是必然，当项目周期长，建立的任务很多，就会出现很多任务行），超过了甘特图的可视区域，就会出现滚动条，导出图片的时候只会导出可视区域内显示的甘特图，其他非可视区域的内容没导出（就是…

阅读更多...

单据是否组织隔离，由单据头或单据体是否存在组织类型字段的“是否主业务组织”决定

单据是否组织隔离，由单据头或单据体是否存在组织类型字段的“是否主业务组织”决定

阅读更多...

推荐文章

最新文章