使用ollama部署deepseek-r1+webUI实践

news/2025/3/13 12:42:51/文章来源:https://www.cnblogs.com/shunzi115/p/18766979
前置条件
使用英伟达显卡下载cuda驱动
https://developer.nvidia.com/cuda-downloads
Ollama

Ollama 官方版: https://ollama.com/

curl -fsSL https://ollama.com/install.sh | sh

使用Ollama启动deepseek模型,也可以启动他的模型
https://ollama.com/search

注意

  • 第一个注册的账号会自动成为管理员
  • 注意更换容器来源网站到 南京大学镜像站(https://sci.nju.edu.cn/9e/05/c30384a564741/page.htm)

ghcr.io -> ghcr.nju.edu.cn

# 模型的安装命令# 1.5B Qwen DeepSeek R1  
# 所需空间大约 1.1G
ollama run deepseek-r1:1.5b# 7B Qwen DeepSeek R1
# 所需空间大约 4.7G
ollama run deepseek-r1:7b# 8B Llama DeepSeek R1
# 所需空间大约 4.9G
ollama run deepseek-r1:8b# 14B Qwen DeepSeek R1
# 所需空间大约 9G
ollama run deepseek-r1:14b# 32B Qwen DeepSeek R1
# 所需空间大约 20G
ollama run deepseek-r1:32b# 70B Llama DeepSeek R1
# 所需空间大约 43G
ollama run deepseek-r1:70b# 671B Llama DeepSeek R1 
# 所需空间大约 404G
ollama run deepseek-r1:671b 
Open WebUI

官方安装文档:https://docs.openwebui.com/

Open WebUI官网文档翻译:

注意:

使用Docker安装Open WebUI时,请确保在Docker命令中包含

-v open-webui:/app/backend/data

这一步至关重要,因为它确保您的数据库正确挂载,避免任何数据丢失。

安装默认配置
1.如果您的计算机上安装了Ollama,可以使用以下命令:

sudo docker run -d -p 80:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

2.如果Ollama在另一台服务器上,请使用以下命令:
连接到另一台服务器上的Ollama时,请将OLLAMA_BASE_URL更改为服务器的URL:

docker run -d -p 80:8080 -e OLLAMA_BASE_URL=https://example.com -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

要使用Nvidia GPU支持运行Open WebUI,请使用以下命令:

docker run -d -p 80:8080 --gpus all --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:cuda

3.仅用于OpenAI API使用的安装
如果您仅使用OpenAI API,请使用以下命令:

docker run -d -p 80:8080 -e OPENAI_API_KEY=your_secret_key -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main 

4.带有捆绑Ollama支持的Open WebUI安装
此安装方法使用一个单独的容器映像,将Open WebUI与Ollama捆绑在一起,通过单个命令实现简化设置。根据您的硬件设置选择适当的命令:

使用GPU支持:通过运行以下命令利用GPU资源

docker run -d -p 80:8080 --gpus=all -v ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama 

仅CPU:如果您不使用GPU,请改用以下命令:

docker run -d -p 80:8080 -v ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama 

这两个命令都支持内置、简单的安装Open WebUI和Ollama,确保您可以快速启动一切。

docker run -d -p 80:8080 -e OLLAMA_BASE_URL=http://192.168.1.100:11434 -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main访问:http://192.168.100.120

常见问题:
默认ollama绑定在127.0.0.1的11434端口,修改/etc/systemd/system/ollama.service,在[Service]下添加如下内容,使ollama绑定到0.0.0.0的11434端口

Environment="OLLAMA_HOST=0.0.0.0"sudo systemctl daemon-reload
sudo systemctl restart ollama

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/898112.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NocoBase 本周更新汇总:双因素身份认证(2FA)

本周更新包括:兼容历史按钮配置按钮权限,AI 集成插件等。原文链接:https://www.nocobase.com/cn/blog/weekly-updates-202503013 汇总一周产品更新日志,最新发布可以前往我们的博客查看。 本周我们发布了 NocoBase 1.6.0 版本,带来集群模式部署、安全策略优化和迁移管理等…

网站开发(1)**基础工具**

使用html、css和javascript进行网站前端开发,使用MySQL、java进行后端开发。 项目工程不算太大,使用VSCode进行编辑和管理。 **安装插件** 在VSCode中安装实时服务器插件:安装成功后,只需要对我们正在编写的html文件右键,选择“Open with Live Server”,然后选择指定浏览…

高密度SNP芯片/Flowcell加工工艺路线-芯晨微纳(河南)-专注于河南郑州激光代加工

★★★文章来源 网络、新闻采访、专利等公开信息,仅用于学习 文章由芯晨微纳(河南)光电科技有限公司搜集整理

使用MMSeg1.2.2进行可视化

1. 对image进行预测和mask进行可视化 1.1 使用mmsegmentation/tools/analysis_tools/feature_map_visual.py进行推理: 编写脚本进行可视化推理,需要打开wandb(详情可见MMSeg官方手册),输入格式为python feature_map_visual.py \ (imaeg_path) \ (configs_path) \ (checkpo…

四代固态纳米孔测序芯片/Flowcell加工工艺路线/厂家调研-芯晨微纳(河南)-专注于河南郑州激光代加工

纳米孔测序(Nanopore Sequencing)是一种基于单分子检测的第三代测序技术,其核心原理是通过纳米孔结构实时监测分子(如DNA、RNA)通过孔道时引起的电信号变化,从而实现碱基序列的识别。与传统的测序技术(如Illumina的合成测序)相比,纳米孔测序具有长读长、实时分析、无需…

gdb调试汇编

首先是函数传参, 先说下edi esi edx ecx 和 rdi rsi rdx rcx的关系 正常的centos x86的架构, 函数的前6个参数一般是用着几个寄存器存储的 edi esi edx ecx r8 r9(也可能是rdi rsi rdx rcx r8 r9),从左依次往右 第7个参数以后,就放在栈上了,也就是通过栈传递,每个参数…

【每日一题】20250313

【每日一题】如图所示,足够长平行金属导轨倾斜放置,倾角为 \(37^{\circ}\),宽度为 \(0.5 \; \mathrm{m}\),电阻忽略不计,其上端接一小灯泡,电阻为 \(1 \; \Omega\).一导体棒 \(MN\) 垂直于导轨放置,质量为 \(0.2 \; \mathrm{ kg }\),接入电路的电阻为 \(1 \; \Omega\)…

如何在VMWare Workstation中为桌面操作系统设置固定的显示分辨率

在虚拟中安装Linux操作系统后进入桌面环境后分辨率会自动拉伸变化,有时候可能不符合使用者的习惯,我们可以先关闭操作系统(必须先关闭操作系统否则不允许设置)然后鼠标右键点击已经安装的操作系统打开设置界面。   在系统设置界面中的《硬件》选项卡中选择点击《显示器》…

ABB IRB6660机器人伺服电机维修

常见故障及原因1. 电机故障 - 过载:当负载超过额定电机负载时触发,例如在搬运超过机器人承载能力的重物时,可能会导致电机过载。 - 高温:长时间运行或散热不良会使电机温度升高,如散热风扇损坏或者工作环境温度过高。 - 绝缘老化:随着使用时间增长,电机的绝缘材料…

四代固态纳米孔测序芯片/Flowcell加工工艺

固态纳米孔测序芯片是一种基于固态材料(如氮化硅、二氧化硅、石墨烯等)制备的纳米孔器件,用于单分子检测(如DNA、RNA、蛋白质等)。其加工工艺涉及微纳制造技术、材料科学和生物工程的交叉领域。以下是其核心加工工艺及关键步骤: 固态纳米孔测序芯片是一种基于固态材料(如…

SNeP1.1 Segmentation fault (core dumped) 段错误

001、问题 002、问题原因:ped文件用tab分割[b20223040323@admin2 test5]$ ls outcome.map outcome.ped step1.slurm [b20223040323@admin2 test5]$ head outcome.ped | cut -f 1-8 GMM1 GMM1 0 0 0 -9 A G G C GMM2 GMM2 0 …

[I.2][个人作业 软件案例分析]

[I.2]个人作业 软件案例分析 我选择QQ音乐作为调研目标 第一部分 软件调研评测 软件使用的图片软件分析使用QQ音乐主要有三种方式,一种是已知目标音乐在搜索框中直接输入进行搜索,第二种是目标音乐在播放但是不知道名字,可以使用听歌识曲的功能,第三种是可以选择根据风格进…