如何给本地部署的DeepSeek投喂数据，让他更懂你-编程知识

如何给本地部署的DeepSeek投喂数据，让他更懂你

news/2025/2/19 9:55:18/文章来源:https://www.cnblogs.com/xiezhr/p/18714692

写在前面

在上一篇文章中，我们说了怎么在本地部署DeepSeek。对本地部署DeepSeek感兴趣的小伙伴看过来。
本地部署 DeepSeek：小白也能轻松搞定！

话说回来了，为啥要本地部署呢？

① 在使用DeepSeek中，经常会出现服务器繁忙，请稍后再试。

② 不想让个人隐私数据暴露出去

③ 可以将各种格式的文件，如pdf、csv、txt、md 格式的数据投喂给它。比如你想让 DeepSeek 了解你的公司业务，就把相关的文档上传给它。

DeepSeek 就能吃下你给它的各种“知识大餐”，然后变得更聪明,更懂你

一、RAG是什么？

为了投喂数据，我们要用到RAG。首先，我们先来了解下什么是RAG？

我们就问问昨天部署好的DeepSeek好了。

首先我们在命令行输入：ollama run deepseek-r1:1.5b 命令，启动DeepSeek

启动DeepSeek

然后打开浏览器并输入快捷键：ctrl+shift+l 调出WebUI可视化AI界面

启动WebUI

输入：RAG是什么？

RAG

翻译成大白话就是：我们把知识放到知识库里，然后把它投喂给人工智能。我们需要用一个量化的工具，把各种格式的数据量化给人工智能，让它能看得懂。

人工智能通过对这些知识的学习后，以后你再问它的时候，他就能将知识提取出来，加工处理后回答你的问题。

RAG 就是让 DeepSeek 不仅能靠自己的知识库回答问题，还能通过检索外部数据来增强回答的准确性和丰富性。就好比你考试时偷偷带了小抄，但 DeepSeek 是光明正大地“作弊”，还能把答案说得头头是道。

二、拉取`nomic-embed-text`

刚说了RAG是啥？我们需要一个RAG工具来完成量化工作。

各种开源免费的RAG工具挺多，我们这里选择最近比较获得ollama 提供的nomic-embed-text。

https://ollama.com/library/nomic-embed-text

nomic-embed-text

我们使用上面圈出来的命令拉取即可，274M，大约1min左右就可以下完，出现【success】字样表示下载成功。

拉取nomic-embed-text

三、RAG设置

打开WebUI界面，我们会看到一个RAG设置文本嵌入模型。

文本嵌入模型就是把我们投喂的各种文档数据量化成DeepSeek认识的数据。

RAG设置

四、添加新知识

工具都准备好后，我们开始准备给DeepSeek投喂数据......

① 投喂前不认识晓凡

在投喂数据之前，我们问问它认不认识晓凡。结果不用我说了，肯定是不知道的 😅

投喂前

② 准备投喂的数据

接下来，将晓凡事先准备好的关于晓凡的简介【程序员晓凡.md】文档投喂给它，文档内容如下。

程序员晓凡简介

③ 投喂数据

添加新知识

投喂程序员晓凡简介

deepseek成功消化投喂知识

④ 投喂完成后，已经认识晓凡了

成功投喂后认识晓凡了

五、其他数据投喂测试

我们准备一个【学生选课系统接口文档 V1.1.md】接口文档

学生选课系统接口文档

按照上面方法进行投喂

添加新知识

接下来，我们我们让DeepSeek 用Java语言实现【获取学生选课信息】这一接口功能

选课接口

本期内容到这儿就结束了，希望对您有所帮助。

我们下期再见ヾ(•ω•`)o (●'◡'●)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/883569.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

Maven入门，读完这篇就够了

Maven 项⽬⽣命周期 Maven从项⽬的三个不同的⻆度，定义了三套⽣命周期，三套⽣命周期是相互独⽴的，它们之间不会相互影响。清理⽣命周期(Clean Lifecycle)：该⽣命周期负责清理项⽬中的多余信息，保持项⽬资源和代码的整洁性。⼀般拿来清空directory(即⼀般的target)⽬录下的…

【第四期书生大模型实战营】L0G3000 Git 基础知识

闯关任务任务1: 破冰活动：自我介绍每位参与者提交一份自我介绍。提交地址：https://github.com/InternLM/Tutorial 的 class 分支～命名格式为 <id>.md，其中 <id> 是您的报名问卷UID。文件路径应为 ./icamp4/。【大家可以叫我】内容可以是 GitHub 昵称、微信…

读算法简史：从美索不达米亚到人工智能时代15读后总结与感想兼导读

读算法简史：从美索不达米亚到人工智能时代15读后总结与感想兼导读1. 基本信息算法简史：从美索不达米亚到人工智能时代克里斯布利克利著中信出版集团股份有限公司,2024年9月出版1.1. 读薄率书籍总字数18.6万字，笔记总字数51653字。读薄率51653186000≈27.77% 1.2. 读厚方…

公众号[1]-「爱数葡萄」v0.6版本发布

「爱数葡萄」是一款基于yolov5的机器视觉软件,主要功能是对葡萄果粒进行计数,目的是助力农业现代化,提高葡萄果园管理效率。「爱数葡萄」v0.6版本发布软件简介「爱数葡萄」是一款基于yolov5的机器视觉软件,主要功能是对葡萄果粒进行计数,目的是助力农业现代化,提高葡萄果园管…

公众号[2]-github项目分享-slambook2.rs项目

宝子们，今天给大家安利一个超酷的项目——slambook2的Rust🔥重构版！这可不是普通的代码重构，而是用Rust语言重新实现的SLAM（同时定位与建图）算法，简直太安全了！(≧▽≦)这个项目提供了超详细的使用说明和开发笔记哦！✨ 宝子们可以用Wasmer运行时直接运行预构建的Wasm…

[2025.2.10 JavaWeb学习]Ajax/Axios Vue-cli Nginx

Ajax 概念Asynchronous JavaScript And XML，异步的JS和XML 作用：数据交换：通过Ajax可以给服务器发送请求，并获取服务器响应的数据异步交互：可以在不重新加载整个页面的情况下，与服务器交换数据并更新部分网页的技术Axios 基本概念对原生的Ajax进行了封装基本使用：前端…

矩阵为\(n*m\)型，\(n\)为行，\(m\)为列，\(n+m-1\)为对角线数量//撇对角线for (int i = 0; i < n + m - 1; i++){for (int j = max(0, i - m + 1); j <= min(i, n - 1); j++){cout << g[j][i - j] << ;}cout << \n;}//捺对角线for (int i = 1 - m; i…

Typora使用指南

Typora 使用方法快捷键标题 +空格=一级标题 +空格=二级标题 +空格=三级标题最多支持6级字体粗体：字体两边+两个** 斜体：字体两边+一个* 斜体加粗：字体两边+三个*** 划横线删除：字体两边+两个~~ 引用：文本前>加空格注意引用只能在首字符。例如只能在首字符进行引…

图解支付系统订单号设计与最佳实践

本文主要讲清楚支付系统订单号（或业务ID）各种设计方案对比，各子域的订单号（或业务ID）为什么要统一规范，以及最佳实践。最后还会简单分析微信支付和支付宝的对客订单号的组成差异。假如你也好奇为什么有了数据库自增ID外还需要业务ID，或者想了解如何在业务ID中编织进业务…

Windows 网络存储ISCSI

本文介绍网络存储ISCSI的主要知识点以及如何通过代码控制挂载。 Windows网络存储有很多协议，我目前学习、稍微有了解的是FTP、SMB、ISCSI，FTP、SMB类似可以用来添加共享文件夹，或者添加映射网络驱动器：我使用FTP都是先建个映射，再将内部的文件夹固定到快速访问。平时使用效…

2022-03-17-hello-world

📌 Thinking No emotion; no journal; less platitude I have a habit of writing diaries in high school, to decrease the pressure and anxiety. So blog inherit it. As time going by, I realize I have to make a review of my life, in every single post, and its r…

2023-01-01-one-wisdom

2023 新年伊始，整理 2022 的陳年筆記時發現有很多不知名，但是又捨不得丟棄的句子，想着乾脆把他們做成引用得了。連着建倉庫，設計頁面，寫腳本一套下來也沒花太多時間，一個簡單的靜態自動部署的網站就建好了: One[1].Tech stackJekyll Github ActionHighlightsEvery single…

如何给本地部署的DeepSeek投喂数据，让他更懂你