Windows下DeepSeek R1简单搭建

news/2025/3/4 3:53:32/文章来源:https://www.cnblogs.com/jxc321/p/18745860

目录
  • 安装 Ollama
    • 简介
    • 安装
  • 运行模型
  • 选择嵌入模型(Embedding)
  • 安装和使用Cherry Studio
    • 配置Cherry Studio
      • 配置使用本地模型
      • 知识库配置

安装 Ollama

简介

Ollama 是一个开源的大型语言模型(LLM)平台,旨在让用户能够轻松地在本地运行、管理和与大型语言模型进行交互。

提供了一个简单的方式来加载和使用各种预训练的语言模型,支持文本生成、翻译、代码编写、问答等多种自然语言处理任务。

支持多种硬件加速选项,包括纯 CPU 推理和各类底层计算架构(如 Apple Silicon),能够更好地利用不同类型的硬件资源

安装

Ollama 官方下载地址:https://ollama.com/download 选择适合你的平台安装包即可

下载完成双击安装包机型安装即可,安装完成后会自动打开终端,如果没有自动打开,可自己打开:按快捷键Win + R后在出现的框中输入cmd运行即可。

运行模型

根据自己电脑的配置和需求先择合适的模型运行,DeepSeek-R1官方基于完整的模型提供了6个蒸馏模型,蒸馏模型相对完整版性能有所下降,但是对显存和内存的配置要求也降低了,我们正常本地部署使用蒸馏版就可以。下面是完整模型和各个蒸馏模型的对比:

模型名称 参数量 模型大小 特点 推荐配置要求
deepseek-r1:1.5b 1.5b 1.1G 轻量级模型,适合低配硬件,性能有限但运行速度快 4G显存、16G内存
deepseek-r1:7b 7b 4.7G 平衡型模型,适合大多数任务,性能较好且硬件需求适中 8G显存、16G内存
deepseek-r1:8b 8b 4.9G 略高于 7B 模型,性能稍强,适合需要更高精度的场景 10G显存、16G内存
deepseek-r1:14b 14b 9.0G 高性能模型,适合复杂任务(如数学推理、代码生成),硬件需求较高 10G显存、32G内存
deepseek-r1:32b 32b 20G 专业级模型,性能强大,适合研究和高精度任务,需高端硬件支持 24G显存、64G内存
deepseek-r1:70b 70b 43G 顶级模型,性能最强,适合大规模计算和高复杂度任务,需专业级硬件支持 40G显存、64G内存
deepseek-r1:671B 671B 404G 超大规模模型,性能卓越,推理速度快,适合极高精度需求

选定模型后,在上面打开的终端中运行以下命令,这里以1.5b模型为例,实际执行把模型名改成你选定的即可。

ollama run deepseek-r1:1.5b

模型下载可能有点慢,等待进度条完成即可进入提问界面,如果卡在一两百兆的下载速度,可以Ctrl + C 中断命令后重新运行,ollama是支持断点续传的:

选择嵌入模型(Embedding)

嵌入式模型(Embedding)是一种广泛应用于自然语言处理(NLP)和计算机视觉(CV)等领域的机器学习模型,它可以将高维度的数据转化为低维度的嵌入空间(embedding space),并保留原始数据的特征和语义信息,从而提高模型的效率和准确性。

我们给模型学习的知识,需要使用嵌入模型传化为嵌入向量才能被模型学习

对于中文文本的学习语料,这里我们选择 bge-m3 作为我们的嵌入模型示例,安装和 deepseek 完全一样,一个命令即可安装

ollama pull bge-m3

注意:嵌入类模型、对话类模型、绘画类模型等各自有各自的功能,其请求方式跟返回内容、结构都有所不同,请勿强行将其他类别的模型作为嵌入模型使用

安装和使用Cherry Studio

Cherry Studio AI 是一款强大的多模型AI 助手,支持iOS、macOS 和Windows 平台。快速切换多个先进的LLM 模型,聚合了主流大语言模型服务。类似的AI客户端还有:AnythingLLM、ChatBox等。需要更复杂功能的还可以看看open-webui,但其需要部署,要求有一定的技术能力

进入官网 https://cherry-ai.com/download 进行下载即可。

官网还有使用文档,不熟悉的可以看一下:https://docs.cherry-ai.com/

配置Cherry Studio

配置使用本地模型

在设置中开启 ollama ,选择管理添加R1模型

然后在首页添加助手,使用默认助手即可,然后编辑助手,在模型设置中使用我们刚刚添加的R1模型

最后把对话框最上面的模型切换成我们刚刚安装的R1模型即可开始进行AI聊天和问答

知识库配置

与推理模型一样,先在设置中将我们的嵌入模型添加上

然后在知识库中创建对应的知识库并上传知识文件,等向量化完成便可以在模型中使用对应的知识库。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/892149.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

学习进度记录贴

本文主要记录作者的各个学习记录🐫学习进度记录帖本贴开立初衷是为了督促作者好好学习,用记录的方式收获一点正反馈。作者目前大三下半学期,由于对考研上不了岸z的担忧,所以想边实习边考研。虽然这是很多人都不建议走的一条路,但是只有这样才能够缓解我的焦虑,让我不必在…

SSL/TLS握手阶段解析

众所周知SSL/TLS是HTTPS的基石,我觉得对经常都在使用的网络需要有进一步的了解。 HTTPS协议全称(Hypertext Transfer Protocol Secure),它与HTTP协议最大的不同就在于更安全。 HTTP是明文协议,所有内容默认都没有经过加密,当然也可以由开发人员将客户端和服务端要发送的内…

CICD+K8s项目实战讲解

CICD 流水先实战,使用git+Jenkins(git+mvn+docker)+ harbor + k8s 1.环境说明

我的公众号接入了DeepSeek-R1模型,成为了一个会深度思考的强大.NET AI智能体!

前言 前不久腾讯元器宣布接入满血版 Deepseek R1 模型,模型免费使用且不限量,为智能体开发提供更多样化的模型选择,带来更丰富的智能体功能和玩法。 今天咱们一起来把我公众号的.NET AI智能体模型从腾讯混元大模型-turbo(32k)切换为DeepSeek-R1(32k),使其拥有深度思考功能变…

图周围添加阴影更逼真 filter:drop-shadow(0 2px 14.7px rgba(0, 0, 0, .08));

filter:drop-shadow(0 2px 14.7px rgba(0, 0, 0, .08));在CSS中,filter 属性可以用来应用图形效果,如模糊、阴影、颜色变换等。drop-shadow 则是 filter 属性中的一种效果,用于给元素添加阴影效果。 语法filter: drop-shadow(offset-x offset-y blur-radius color);offset-x…

趋势还是噪声?ADF与KPSS检验结果矛盾时的高级时间序列处理方法

在时间序列分析领域,评估数据的平稳性是构建准确模型的基础。ADF(Augmented Dickey-Fuller,增广迪基-富勒检验)和KPSS(Kwiatkowski-Phillips-Schmidt-Shin)检验是用于评估时间序列数据平稳性的两种关键统计假设检验方法。当我们遇到ADF检验失败而KPSS检验通过的情况时,这…

读当我点击时,算法在想什么?08读后总结与感想兼导读

读当我点击时,算法在想什么?08读后总结与感想兼导读1. 基本信息 当我点击时,算法在想什么?(瑞典)大卫萨普特(David Sumpter) 著中国科学技术出版社,2025年01月出版1.1. 读薄率 书籍总字数15.9万字,笔记总字数20598字。 读薄率20598159000≈12.95% 1.2. 读厚方向算法霸权极…

7. Nginx 工作机制参数设置(详细讲解说明)

7. Nginx 工作机制&参数设置(详细讲解说明) @目录7. Nginx 工作机制&参数设置(详细讲解说明)1. Nginx 当中的 master-worker 机制原理2. master-worker 机制2.1 accpet_mutex 解决“惊群现象”2.2 Nginx 的 master-worker 工作机制的优势3. Nginx 参数设置3.1 work…

字节码增强要点总结

我们写的Java源代码需要通过Javac等前端编译器转换为Java字节码,虚拟机加载了这些Java字节码后,可以通过解释执行或JIT编译执行转换为本地机器码进行执行,如下图所示。Java虚拟机在加载时认的是Java字节码,而动态类加载可以让我们在需要的时候生成字节码并加载到虚拟机中。…

ragflow-ollama 知识库建立测试

ollama查看模型 C:\Users\DK>ollama show deepseek-r1:7bModelarchitecture qwen2parameters 7.6Bcontext length 131072embedding length 3584quantization Q4_K_MParametersstop "<|begin▁of▁sentence|>"stop &…

北大手册第Ⅲ版已公开,带你深度学习DeepSeek-R1推理模型!

北大手册第Ⅲ版已公开,带你深度学习DeepSeek-R1推理模型!随着DeepSeek的全球风靡和广泛应用,智能化的普及步伐显著加快。通过对算法、模型和系统的系统级协同创新,DeepSeek汇聚了众智与众力,创造了许多精彩成果。为了更好的使用DeepSeek-R1大模型,使其能够为我们提供更专…