一种在本地部署 Deepseek-R1 蒸馏小模型的方法-编程知识

一种在本地部署 Deepseek-R1 蒸馏小模型的方法

news/2025/2/6 20:34:36/文章来源:https://www.cnblogs.com/chenaknoip/p/18701640

摘要：2025 年 1 月，DeepSeek 的 R1 模型发布一周之后，DeepSeek 刷屏主流媒体和社交网站。但由于一些原因，DeepSeek 的网页和 API 多次提示服务器繁忙。本文基于一开源 LLM 服务工具 Ollama 对本地部署 DeepSeek-R1 蒸馏小模型提供了一种方法。

关键词：DeepSeek，Ollama，部署

一、Ollama 的安装

用户可以访问 Ollama 官网或其 GitHub 仓库进行下载。

二、DeepSeek 的部署和使用

用户可以打开命令行程序，输入命令 ollama run <模型名> 来进行模型的部署和使用。

如果用户未曾安装过对应的模型，则 Ollama 会在联网的条件下自动下载模型；反之则会打开模型的会话。

想要查询对应的模型名称，可以在 Ollama 官网 Models 选项中进行搜索，找到适合自己设备的版本。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/879801.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

2024.2.6鲜花

2024.2.6鲜花

初探牛顿迭代？推歌《以恋结缘》诚、意地の悪い神の所业か？奇迹？縁？袂触合う不思议花ひとひら揺れて不意に宿ってたうなじ解いてく春风戯れはそこそこに恋手ほどきしてくだしゃんせ汤気にほんのり頬染て夜风に愿ふ …いざ！！蝶と舞ひ花となりて衣を乱して祓いま…

阅读更多...

megatron 2. TP和PP实现

megatron 2. TP和PP实现

megatron 源码阅读第二篇, 看了TP和PP的对应实现训练并行实现 TensorParallel 张量并行代码路径, 代码路径: megatron/core/tensor_parallel 主要包含Linear / VocabEmbedding / cross_entropy 三部分. Linear 参数初始化如果是从checkpoint热启, perform_initialization需要打…

阅读更多...

【Azure Policy】当Azure策略组中存在多个修正任务时候时的批量处理办法

【Azure Policy】当Azure策略组中存在多个修正任务时候时的批量处理办法

问题描述在分配一组策略中包含了很多修正任务时候，从门户上，只能选择一个修正任务执行。如下图：是否有好的办法，执行全部的修正任务呢？问题解答从Azure门户的设计来看，只能选择一个修正任务是设计使然。如果想批量执行全部的修正任务，需要使用PowerShell脚本来循环执…

阅读更多...

Kotlin空安全

Kotlin空安全

前言访问空引用的成员变量就会导致空指针异常，在Java中被称作NullPointerException，简称NPE，Kotlin中NPE产生的原因只可能是以下几种：显式调用 throw NullPointerException()使用了!!操作符数据在初始化时不一致，例如：传递一个在构造函数中出现的未初始化的 this 并用于…

阅读更多...

Kotlin控制流程

Kotlin控制流程

条件与循环 if表达式 Kotlin中的if与Java中的if大致上都差不多，但是Kotlin中没有三元运算符（A ? B : C），可以用if表达式作为代替，例如： Java int a = int a = System.currentTimeMillis() % 2 == 1L ? 1 : 0; Kotlin val a = if (System.currentTimeMillis() % 2 == 1L…

阅读更多...

第一次用Markdown

第一次用Markdown

标题标题2 标题3 标题4 字体字体字体姓名性别年龄张三男 20![das]() baidu

阅读更多...

【测试基础】web3.0介绍

【测试基础】web3.0介绍

web3.0介绍 Web3.0也被称为下一代互联网，是对当前互联网（Web2.0）的演进和升级。其目标是实现一个更加去中心化、安全、用户拥有数据主权且具有更好互操作性的互联网环境。Web3.0的核心技术包括区块链、智能合约和加密货币等。 web2.0与web3.0区别 Web2.0和Web3.0的主要区别在…

阅读更多...

区块链原理、技术与实践

区块链原理、技术与实践

区块链介绍区块链是一种分布式账本技术，允许多个参与者共同维护一个不断增长的数据记录列表，每个区块包含一系列交易记录，并通过密码学方法与前一个区块链接起来，形成一个不可篡改和不可逆的链条。这种基于共识的机制使得区块链具有高度的安全性和透明性。区块链与传统W…

阅读更多...

《高效能人士的七个习惯》

《高效能人士的七个习惯》

情感账户勇气和体谅大石头自传式回应、同理心倾听：用你的话反映他们的感受和意思，而不是去评论、去判断是否正确

阅读更多...

高效能人士的七个习惯

高效能人士的七个习惯

情感账户勇气和体谅大石头自传式回应、同理心倾听：用你的话反映他们的感受和意思，而不是去评论、去判断是否正确

阅读更多...

新春“码”启 | Cocos 3D 微信小游戏（第5天）：分包构建和上传发布（完美收官）

新春“码”启 | Cocos 3D 微信小游戏（第5天）：分包构建和上传发布（完美收官）

新春开发 Cocos 3D 微信小游戏计划的第 5 天，详细介绍了如何利用Cocos Creator开发并发布一款3D微信小游戏，包括游戏状态机的设计理念，和微信小游戏主包大小限制时的解决方案——分包策略。从游戏设计、开发、调试到最后成功发布的全过程，为想要进入微信小游戏开发领域的开…

阅读更多...

爬虫随笔（一）

爬虫随笔（一）

爬虫随笔，某牛前几天一直在看js逆向，现在分享一下本人近期学习记录首先分享一个网站，这个网站可以获得request所需要的header和cookie https://curlconverter.com/ 爬取网站就不挂了简单观察发现，该网站是滑动加载，我们可以在滑动加载时获得我们所需要的接口，发现两个链…

阅读更多...

推荐文章

最新文章