用deepseek4j开发私有大模型知识库-编程知识

用deepseek4j开发私有大模型知识库

news/2025/2/24 7:08:24/文章来源:https://www.cnblogs.com/liucs/p/18718067

DeepSeek R1 凭借其强大的思维链能力在开发者中广受欢迎，但 Spring AI 等主流框架对其支持不足，特别是在思维链内容保留和流式输出方面存在诸多限制。deepseek4j 1.4 版本重磅发布支持向量模型等重要更新。

背景

deepseek4j 提供了一套强大的 API，涵盖了 Reasoner、Function Calling、JSON 解析等特性。本工具旨在简化 DeepSeek API 的集成，让开发者能够快速调用相关能力并集成到自己的应用中。然而，DeepSeek 官方并未提供向量模型，因此本工具在最初设计时未考虑向量搜索的集成。

现状

deepseek4j 已全面支持 DeepSeek 的 Reasoner、Function Calling、JSON 解析等功能。
R1 模型的私有知识库需求正在增长，许多开发者希望在 DeepSeek 之上实现私有知识库。

经过深入的技术方案评估，我们选择了一个优雅的解决方案：通过兼容 OpenAI 协议标准来集成向量模型能力。这种方案具有以下优势：

零额外依赖：无需引入新的依赖包，保持框架轻量
完美兼容性：与现有架构无缝衔接，确保向后兼容
标准化接入：采用业界通用的 OpenAI 协议，降低学习成本

快速上手

本文章将带领大家从零开始构建一个基础 RAG 系统。通过白盒编码的方式，不仅能深入理解 RAG 的核心原理，还可以根据实际需求灵活调整和优化各个环节。相比直接使用现有的开源 RAG 产品，这种方式能让我们更好地掌控系统行为，实现更精准的知识检索和问答效果。

1. 环境准备

在开始构建 RAG 系统之前，我们需要准备以下环境：

1.1 Ollama 模型准备

首先安装 Ollama，然后下载以下必要的模型：

# 下载推理模型 - 用于理解和生成回答
ollama run deepseek-r1:14b# 下载向量模型 - 用于文本向量化
ollama run bge-m3:latest

1.2 向量数据库准备

这里使用 Milvus 作为向量数据库，你可以选择以下两种方式之一进行安装：

方式一：使用 milvus 测试环境

访问 Zilliz Cloud 中文版：https://cloud.zilliz.com.cn
获取连接信息（后续配置需要用到）

方式二：Docker 安装

# 1. 下载安装脚本
curl -sfL https://raw.githubusercontent.com/milvus-io/milvus/master/scripts/standalone_embed.sh -o standalone_embed.sh

# 2. 启动 Docker 容器
bash standalone_embed.sh start

初始化向量数据：创建本次知识库存储、获取链接信息和表信息：

1.3 项目依赖

在你的 Maven 项目中添加以下依赖：

<dependency><groupId>io.github.pig-mesh.ai</groupId><artifactId>deepseek-spring-boot-starter</artifactId><version>1.4.0</version>
</dependency>
<!-- 链接 milvus SDK-->
<dependency><groupId>io.milvus</groupId><artifactId>milvus-sdk-java</artifactId><version>2.5.3</version>
</dependency>

application.yml 配置：

# 推理模型链接信息
deepseek:base-url: http://127.0.0.1:11434/v1model: deepseek-r1:14bapi-key: ollama-local
# 向量模型链接信息
embedding:api-key: ${deepseek.api-key}base-url: ${deepseek.base-url}model: bge-m3:latest

2. 初始化私有知识

在构建 RAG 系统时，第一步是将已有的知识内容转换为向量形式并存储到向量数据库中。

2.1 创建链接链接客户端

// 1. Connect to Milvus server
ConnectConfig connectConfig = ConnectConfig.builder().uri(CLUSTER_ENDPOINT) // 1.2 获取的 Milvus 链接端点.token(TOKEN)  // 1.2 获取的 Milvus 链接信息
        .build();MilvusClientV2 milvusClientV2 = new MilvusClientV2(connectConfig);

2.2 准备资料并向量化上传

以下示例为了节约篇幅，以处理纯文本资料。对于 Office 文档、图片、PDF、音视频等其他格式的文件处理，deepseek4j 提供了完整的解决方案。

@Autowired
EmbeddingClient embeddingClient;{// 这里以2025最新的我司保密条例演示，可以换成你自己的String law = FileUtil.readString("/Users/lengleng/Downloads/law.txt", Charset.defaultCharset());String[] lawSplits = StrUtil.split(law, 400);List<JsonObject> data = new ArrayList<>();for (String lawSplit : lawSplits) {List<Float> floatList = embeddingClient.embed(lawSplit);JsonObject jsonObject = new JsonObject();// 将 List<Float> 转换为 JsonArrayJsonArray jsonArray = new JsonArray();for (Float value : floatList) {jsonArray.add(value);}jsonObject.add("vector", jsonArray);jsonObject.addProperty("text", lawSplit);data.add(jsonObject);}InsertReq insertReq = InsertReq.builder().collectionName("deepseek4j_test").data(data).build();milvusClientV2.insert(insertReq);
}

3. 创建 RAG 接口

@GetMapping(value = "/chat", produces = MediaType.TEXT_EVENT_STREAM_VALUE)
public Flux<ChatCompletionResponse> chat(String prompt) {MilvusClientV2 milvusClientV2 = new MilvusClientV2(connectConfig);List<Float> floatList = embeddingClientOptional.get().embed(prompt);SearchReq searchReq = SearchReq.builder().collectionName("deepseek4j_test").data(Collections.singletonList(new FloatVec(floatList))).outputFields(Collections.singletonList("text")).topK(3).build();SearchResp searchResp = milvusClientV2.search(searchReq);List<String> resultList = new ArrayList<>();List<List<SearchResp.SearchResult>> searchResults = searchResp.getSearchResults();for (List<SearchResp.SearchResult> results : searchResults) {System.out.println("TopK results:");for (SearchResp.SearchResult result : results) {resultList.add(result.getEntity().get("text").toString());}}ChatCompletionRequest request = ChatCompletionRequest.builder()// 根据渠道模型名称动态修改这个参数.model("deepseek-r1:14b").addUserMessage(String.format("你要根据用户输入的问题：%s \n \n 参考如下内容： %s  \n\n 整理处理最终结果", prompt, resultList)).build();
   return deepSeekClient.chatFluxCompletion(request);
}