快速入门 DeepSeek-R1 大模型

news/2025/3/12 17:10:43/文章来源:https://www.cnblogs.com/guoxiaoyu/p/18697085

国内最新的神级人工智能模型已经正式发布,没错,它就是备受瞩目的DeepSeek-R1大模型。今天,我们将对DeepSeek进行一个简单的了解,并探索如何快速使用和部署这个强大的工具。值得一提的是,DeepSeek已经开源,您可以随意下载和使用它。

DeepSeek的官方网站地址如下:https://www.deepseek.com/

API文档的详细地址请访问:https://api-docs.deepseek.com/zh-cn/

好吧,让我们开始!

API

DeepSeek API 采用与 OpenAI 完全兼容的 API 格式,使得用户可以通过简单的配置修改,灵活地使用 OpenAI SDK 来访问 DeepSeek API。此外,还可以使用任何与 OpenAI API 兼容的软件进行接入。

在对话领域,OpenAI 的 ChatGPT 可以说是最早引领风潮的模型之一,因此很多框架都自然而然地集成了 OpenAI 接口。这种趋势促使后续的各种模型纷纷兼容 OpenAI 的接口特性,从而极大地方便了开发者,减少了接入工作量。

为了轻松切换到 DeepSeek API,我们只需将 OpenAI 的基础 URL 替换为 DeepSeek 的地址,具体操作如下所示:

# Please install OpenAI SDK first: `pip3 install openai`from openai import OpenAIclient = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")response = client.chat.completions.create(model="deepseek-chat",messages=[{"role": "system", "content": "You are a helpful assistant"},{"role": "user", "content": "Hello"},],stream=False
)print(response.choices[0].message.content)

注意model='deepseek-chat'调用的是DeepSeek-V3模型,model='deepseek-reasoner'才是DeepSeek-R1大模型。

服务状态

目前由于国际原因,API服务不是很稳定,所以如果在调用其API接口如果无法及时响应,可以看下目前API服务状态。地址如下:https://status.deepseek.com/

如图所示:

image

实用集成

轻松将 DeepSeek 大模型的强大能力集成到各类软件中,助您提升应用的智能化水平。该平台支持众多第三方软件,具体支持的软件种类请见下图所示:

image

这种方法既可以调用官方的API服务,当然也可以调用本地的大模型服务,毕竟官方服务状态目前很不稳定。

Ollama

如果想在本地访问 DeepSeek 服务,那么你可以选择Ollama ,Ollama 是一个开源工具,旨在帮助用户在本地环境中轻松运行和管理大型语言模型(LLMs)。它通过简化的方式支持多种模型(如 Llama、Mistral、Gemma 等),并提供统一的接口供开发者调用,尤其适合需要本地部署和灵活切换模型的场景。

地址如下:https://ollama.com/

image

下载后,直接在本地运行命令即可。

ollama run deepseek-r1

当然,你可以选择启动的模型参数。目前有如下可选择:

ollama run deepseek-r1:1.5b

ollama run deepseek-r1:7b

ollama run deepseek-r1:8b

ollama run deepseek-r1:14b

ollama run deepseek-r1:32b

ollama run deepseek-r1:70b

参数越大,模型效果越好。

总结

总之,DeepSeek-R1大模型凭借其强大的性能和开源优势,为开发者带来了前所未有的机遇。无论是通过API快速接入,还是借助Ollama在本地部署,都能轻松实现智能化升级。虽然目前API服务存在一些稳定性问题,但随着技术的不断优化,相信这些问题将很快得到解决。未来,DeepSeek有望在更多领域大放异彩,推动人工智能技术的进一步发展。


我是努力的小雨,一个正经的 Java 东北服务端开发,整天琢磨着 AI 技术这块儿的奥秘。特爱跟人交流技术,喜欢把自己的心得和大家分享。还当上了腾讯云创作之星,阿里云专家博主,华为云云享专家,掘金优秀作者。各种征文、开源比赛的牌子也拿了。

💡 想把我在技术路上走过的弯路和经验全都分享出来,给你们的学习和成长带来点启发,帮一把。

🌟 欢迎关注努力的小雨,咱一块儿进步!🌟

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/878103.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CompletableFuture 超时功能有大坑!使用不当直接生产事故!

CompletableFuture 超时功能有大坑!使用不当直接生产事故! 本文未经允许禁止转载! 上一篇文章《如何实现超时功能(以CompletableFuture为例)》中我们讨论了 CompletableFuture 超时功能的具体实现,从整体实现来说,JDK21前的版本有着内存泄露的bug,不过很少对实际生产有影…

2024.2.2 鲜花

P2305 [NOI2014] 购票aLIEz 決めつけばかり 自惚れを着たチープな hokori で 音荒げても 棚に隠した哀れな 恥に濡れた鏡の中 都合の傷だけひけらかして 手軽な強さで勝取る術を どれだけ磨いでも気はやつれる ふらついた思想通りだ 愛-same-CRIER 愛撫-save-LIAR Eid-聖-Risin…

昆明理工大学25考研冶金工程预计调剂145人

冶金工程考研809冶金物理化学有色冶金学有色金属冶金冶金过程及设备F002钢铁冶金学

8.数据结构

空气在他的呼吸间化作赤红烈焰,烈火在他掌中咆哮翻涌,如同猛兽般肆虐纵横,每一缕火舌都在嘶吼着征服与毁灭。他以战神的姿态掌控炽炎,以焚天煮海之势,在这场杀戮盛宴中肆意狂舞!数据结构 开题顺序: \(WHABCEI\) \(A\) CF2042D Recommendations扫描线维护 \(\le l\) 的最…

ollama mac使用

教程地址:https://www.youtube.com/watch?v=SRroLOci0CA 安装完成后,常用命令。 启动服务:ollama run deepseek-r1:8B 使用:停止服务:本文来自博客园,作者:NeverLateThanBetter,转载请注明原文链接:https://www.cnblogs.com/do-it-520/p/18697037韶华易逝,不能虚度年…

07. 文件操作

一、文件的查找我们可以使用 find 命令 从指定目录向下递归地遍历其各个子目录,将满足的文件显示在终端中。 find [搜索范围] [选项]其中,选项的可选值如下:-name 文件名:按照指定的文件名查找文件,如果不知道文件的全名,可以使用 * 进行模糊匹配。 -user 用户名:查找属…

《计算机网络》笔记——第五章 运输层

计算机网络(第7版)谢希仁目录第5章 运输层概述运输层的两个主要协议端口用户数据报协议UDPUDP的首部格式传输控制协议TCPTCP的连接可靠传输的工作原理停止等待协议连续ARQ协议TCP报文段的首部格式TCP可靠传输的实现滑动窗口超时重传时间(RTO)的选择选择确认SACKTCP的流量控制…

[Paper Reading] DeepSeek-V3 Technical Report

目录DeepSeek-V3 Technical Report解读TL;DR优势训练数据参数量Method架构MLA(Multi-Head Latent Attention)DeepSeekMoEMoEDeepSeekMoEMTP(Multi-Token Prediction)基建FP8训练部署PrefillingDecodingPre-TrainingDataLong Context ExtensionPost-TrainingSFTReinforcement Le…

表单标签3

如何点击用户名来唤醒对应光标 中for id 两者的对象一致

省选模拟4

省选模拟4 A 小丑做法,设 \(f_{S,i,j}\) 为使用边权 \(\le j\) 的边连通了集合 \(S\),里面使用了 \(i\) 个 \(a\) 的最小生成树。 转移朴素枚举,复杂度 \(O(3^nm^3)\) B 是原题。 注意到一个点走过一轮后,从父亲离开后下一次访问会完全访问。 因此可以 dfs 求得一个节点会在…