2025年春节前DeepSeek着实火了一把,记得刚看完美国总统特朗普召集孙正义,让他投资5000亿美金资助美国的“星际之门”计划。两天后DeepSeek出圈,轰动全球AI界。它只花费了500万美金就训练出了媲美OpenAI大模型的推理模型,关键还是开源免费的,太强了。过年前的几天瞬间在网络火爆开来,趁着放假休息我也赶紧了解了解这个DeepSeek。
1. 安装ollama
ollama是一个开源的大语言模型服务工具。目的就是简化在本地运行大模型的过程,降低部署门槛。官方网站地址:ollama
我们可以在其官方网站上面,下载安装对应操作系统的版本工具,进行安装。
2. 下载DeepSeek对应的推理模型
安装好ollama工具之后,就需要下载对应的推理模型。打开这个链接按照说明下载:deepseek-r1。
打开终端管理器,在控制台输入如下命令进行安装。
ollama run deepseek-r1:1.5b
这是15亿参数的模型,相对较小,模型文件大小大概为1G。
模型下载之后,可以执行如下命令查看状态。
然后我们就可以启动这个模型,与其进行对话了。
3. 安装cherry studio工具
在控制台进行会话不太方便,我们需要可视化的对话工具。目前有两个比较流行,一个是chatbox,一个是cherry studio,这里选用cherry studio。cherry studio可以自行配置各种大语言模型API。官方网站:cherry studio。
我们在官网上面下载安装cherry studio,进行如下简单的配置即可。
点击设置,选择Ollama启用。点击图中的管理按钮,选择下载好的deepseek-r1:1.5b模型。
然后在会话页面选择默认模型即可。
我们尝试提问之后,我们本地跑的还挺快。根据官网的建议,如果是代码生成,建议Temperature调整为0。官方网址:deepseek_api。
在cherry设置里面,将温度调整为0即可。
如上就完成了DeepSeek的本地化部署,赶紧去玩一玩吧。如上模型是可以离线使用的!