腾讯云HAI服务器上部署与调用DeepSeek-R1大模型的实战指南

news/2025/2/5 17:21:33/文章来源:https://www.cnblogs.com/guoxiaoyu/p/18699495

上次我们大概了解了一下 DeepSeek-R1 大模型,并简单提及了 Ollama 的一些基本信息。今天,我们将深入实际操作,利用腾讯云的 HAI 服务器进行 5 分钟部署,并实现本地 DeepSeek-R1 大模型的实时调用。接下来,我们直接进入部署过程。

服务器准备

首先,我们需要登录腾讯云平台并购买 HAI 应用服务。腾讯云提供了两种计费方式:包月计费和按时计费。由于我目前并没有特别紧迫或庞大的需求,因此为了节省成本,我选择了按时计费方式。具体的购买流程和配置选项可以参考下面的图示:

image

在我完成购买后,腾讯云 HAI 服务器会自动为我们部署 DeepSeek-R1 模型并启动运行,整个过程非常简便。同时,HAI 还提供了算力连接的选择,具体有三种不同的方式:

  1. ChatBotUI:这是一种广泛应用的可视化聊天界面,它不仅支持实时的聊天互动,还具备管理聊天记录和提示词模板等功能,非常适合需要快速构建对话系统的场景。
  2. CloudStudio:CloudStudio 是一款功能强大的在线集成开发环境(IDE)。它允许我们编写 Python 脚本、调试代码、进行多种应用开发和测试,非常适合开发者进行项目调试和优化。
  3. JupyterLab:作为一种极为流行的数据科学工具,JupyterLab 提供了多个终端选择,包括 Linux 终端和 Python 脚本执行环境。它为数据分析、模型训练及执行等任务提供了非常便捷的支持。

ChatBotUI

在这里,我们首先来了解一下可视化界面,并演示如何快速上手使用。通过这一界面,用户可以直观地进行各种操作,轻松实现需求的配置和调整。具体的操作步骤和界面效果可以参考下面的图示:

image

可以选择其他选项,虽然有时候需要进行角色授权,授权过程非常简单,点击“授权”按钮即可完成,无需进行复杂操作。一旦授权完成,你便可以进入聊天界面。在该界面中,HAI服务器提供了多种参数选项,例如7B和1.5B。选择合适的参数后,你就可以立即开始实时聊天,无需等待。

image

ollama终端

我们继续选择JupyterLab方式连接算力,这里选择终端,如图所示:

image

我们去看下终端命令查看下,如图所示:

image

在这里,我们可以看到其实它使用的也是基于Ollama运行的DeepSeek-R1大模型。通过这种方式,用户可以非常方便地直接使用Ollama提供的命令,来查看和操作相应的API接口。如图所示:

image

这里我们演示的是直接使用 Ollama 运行 DeepSeek-R1 大模型,模型参数为 1.5B。要结束当前会话,您可以使用快捷键 Ctrl + D 退出。不过,需要注意的是,采用这种方式仅支持在本地运行和启动,无法进行外网调用或配置远程访问。

因此,如果希望实现外网访问或其他更复杂的配置,接下来的步骤将会介绍相关方法。

ollama-API服务

这里我们查看ollama如果想要启动大模型服务接口,可以使用ollama serve命令启动,如图所示:

image

可以看到,系统已经成功开机并启动,且绑定的端口号为6399。在这种情况下,我们只需直接开放该端口即可。值得注意的是,HAI服务器还提供了外网IP地址,因此我们可以通过访问该IP来进行端口的开放设置。

image

接下来,我们将按照Ollama的API文档中的指引,完成端口设置的操作。具体操作流程如下所示:

image

CloudStudio连接

启动完API服务后,我们直接使用CloudStudio进行本地调用。新建一个py文件,代码内容如下:

from openai import OpenAIclient = OpenAI(api_key="ollama", base_url="http://localhost:6399/v1/")response = client.chat.completions.create(model="deepseek-r1:1.5b",messages=[{"role": "system", "content": "You are a helpful assistant"},{"role": "user", "content": "Hello"},],stream=False
)print(response.choices[0].message.content)

这里虽然写了api-key信息,但是ollama是不会校验的,你可以写任何字符串,以为这个参数是方法必传参数。结果运行如下:

image

如果你安装完openai依赖包,但仍是无法找到,那么你就在CloudStudio中添加虚拟环境即可,命令如下:

python -m venv venv

然后再执行pip3 install openai命令即可成功运行。当然这里是本地测试,你也可以使用公网IP进行配置并调试。

总结

通过本次实践,我们成功地使用腾讯云的HAI服务器进行了DeepSeek-R1大模型的部署与实时调用。从购买HAI应用服务,到通过ChatBotUI、JupyterLab、CloudStudio等工具进行配置和调试,我们详细介绍了每个步骤。

通过本地和外网API的操作,我们不仅了解了模型部署的基本流程,还掌握了如何利用Ollama提供的API服务进行大模型调用。


我是努力的小雨,一个正经的 Java 东北服务端开发,整天琢磨着 AI 技术这块儿的奥秘。特爱跟人交流技术,喜欢把自己的心得和大家分享。还当上了腾讯云创作之星,阿里云专家博主,华为云云享专家,掘金优秀作者。各种征文、开源比赛的牌子也拿了。

💡 想把我在技术路上走过的弯路和经验全都分享出来,给你们的学习和成长带来点启发,帮一把。

🌟 欢迎关注努力的小雨,咱一块儿进步!🌟

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/879163.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

d2l-ResNet

动手学深度学习笔记-ResNet残差网络 ResNet 核心思想:每个附加层应该更容易地包含原始函数x作为其元素之一。

阮梅

气质温婉优雅的学者,「天才俱乐部」#81号会员,生命科学领域的专家。 凭借天赋与惊人的执著得到了博识尊的瞩目,在秘密的角落开始了对生命本源的研究与探索。 并因此被黑塔邀请,同螺丝咕姆、斯蒂芬联合开发了「模拟宇宙」。 私下里,她十分喜爱传统戏剧与点心,对刺绣也很感…

多头潜在注意力(Multi-Head Latent Attention,MLA)

在 DeepSeek 模型中,多头潜在注意力(Multi-Head Latent Attention,MLA) 是一种关键技术,旨在通过低秩压缩方法优化注意力机制的计算效率和内存使用。MLA 通过对键(Key)和值(Value)进行低秩联合压缩,显著减少了推理过程中的键值缓存(KV Cache),在保持模型性能的同时…

nexttrace :一款开源可视化的路由追踪工具

一、文章来源 今天要给大家推荐一个 GitHub 开源项目 sjlleo/nexttrace,该项目在 GitHub 有超过 700 Star,用一句话介绍该项目就是:“An open source visual route tracking CLI tool”,一款开源可视化的路由追踪工具。 https://www.ajmwz.com/15965.html二、工具介绍 next…

scroll-view标签滚动条

在nuiapp里做滑动tab时用scroll-view标签会出现滚动条情况,以下为搜索结果:但是只有第四个有效: 在微信小程序中,<scroll-view> 组件的 scrollbar-width 属性确实可以用来隐藏滚动条,但有时可能会因为平台或版本差异导致该属性无效。如果 scrollbar-width="0&q…

vue3 model.ts render中的按钮被点击时将事件传递到vue页面

背景:列表中的字段配置放在model.ts中,models.ts中某个字段可以点击,当点击发生时需要将点击事件传递到vue页面,页面再做出相应处理。 我的model.ts配置的表格列: 再点击button时,该点击事件仅在model.ts内可用,无法传递到外部,所以使用vue的依赖注入方法,代码也比较简…

DeepSeek的崛起:未来5年内,项目管理市场的10大投资机会

一、AI 驱动的智能项目管理平台(一)核心技术与优势随着 DeepSeek 推动 AI 技术的不断突破,智能项目管理平台成为极具潜力的投资方向。这类平台深度融合自然语言处理(NLP)、机器学习(ML)、深度学习(DL)等 AI 技术,实现项目管理全流程的智能化革新。自然语言处理技术让…

db_recovery_file_dest_size满了处理(ORA-19815)附带清理alert日志和trace日志

背景 oracle上生产后常见问题 错误截图ORA-19809: ▒▒▒▒▒˻ָ▒▒ļ▒▒▒▒▒▒▒▒ ORA-19804: ▒޷▒▒▒▒▒ 926934528 ▒ֽڴ▒▒̿ռ▒ (▒▒ 15955132416 ▒ֽ▒▒▒▒▒▒▒) 2025-02-05T14:24:35.312123+08:00 ARC0: Error 19809 Creating archive log file to /…

DC-DC电路如何应用前馈电容?(非原创)

电源是现代电子产品必不可缺的模块,现今大多数的通用电源芯片都会提供如下图所示的反馈引脚,便于客户使用反馈电阻实现所需的输出,简化设计并节省调试时间。但是通用化也从根本上制约了转换器的带宽及瞬态响应能力。这种情况下,设计师可以通过使用前馈电容在一定程度上对此…

Deepseek免费无限量API无需本地部署就可用最大70B蒸馏模型

一、DeepSeek概述 2025年1月20日,DeepSeek正式发布 DeepSeek-R1 模型,并同步开源模型权重。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。 DeepSeek-V3和DeepSeek-R1两款大模型,成本价格低廉,性能与OpenAI相当,…

17C++循环结构-(do-while循环)2

1、模拟法; 2、纯小数转化为最简分数一、实例 1、模拟法1 在一次风之巅小学文艺汇演中,狐狸老师、尼克、格莱尔同台演出,其中个环节是拍手游戏,狐狸老师每1秒拍一次手,尼克每2秒拍次,格莱尔每4秒拍一次。三人同时开始拍第一次手,每人都拍10次。 试编一程序,算一算观众可听…

智能编码在前端研发的创新应用

今天主要想分享一些关于大模型如何协助我们进行前端编码的实践。首先,让我们以一个前端开发的实例开始。通常,当需要实现一个新的前端功能时,我们会收到相关的背景和需求描述。一、前端开发实例 今天主要想分享一些关于大模型如何协助我们进行前端编码的实践。首先,让我们以…