把Ollama安装到D盘并使用NVIDIA GPU运行大模型

news/2025/2/22 9:44:33/文章来源:https://www.cnblogs.com/passacaglia/p/18730579

Ollama安装到D盘

.\OllamaSetup.exe /DIR="D:\Program Files\Ollama"

Ollama模型设置到D盘

添加环境变量
变量名:OLLAMA_MODELS
变量值:D:\ollama\models

让Ollama使用GPU

Ollama安装好后,为了让推理跑在GPU上,可以按照如下步骤 设置环境变量:

变量名:OLLAMA_GPU_LAYER
变量值:cuda

如果需要指定特定的 GPU,可以添加以下环境变量:

变量名:CUDA_VISIBLE_DEVICES
变量值:GPU的UUID(按编号有时找不到,所以使用UUID)在控制台输入 nvidia-smi -L ,即可查看GPU的UUID

显卡相关

需要安装新版本的CUDA才能使用GPU(可能最小也得是CUDA 11 才行,我的原本是CUDA 10版的driver)

查看CUDA版本
  1. nvidia-smi
  2. 或者桌面点右键,NVIDIA Control Panel,左下角 System Information,第二个选项卡 Components,3D Settings 第三行,NVCUDA64.DLL,NVIDIA CUDA 12.8.51 driver(代表是安装的12.8.51)【驱动更新之前是10.0的版本,运行ollama的时候,报下面的错误😂,估计是cuda版本太低】
The procedure entry point cuMemGetAllocationGranularity could not be located in the dynamic link library D:\Program Files\ollama\lib\runners\cuda_v11_avx\ggml_cuda_v11.dll.
用NVIDIA App来安装最新驱动

https://www.nvidia.cn/software/nvidia-app/
下载NVIDIA App,把显卡驱动更新到最新版

另外

CudaToolkit的安装包,不是必须的,只需要显卡驱动安装好,然后保证上面的版本最新就可以了

其他

ollama 常用指令
  • ollama ps 查看CPU/GPU使用情况
  • ollama list 查看已经下载的模型
  • ollama run xxxx 运行模型
nvidia 指令
  • 利用指令 nvidia-smi查看Nvidia显存应用情况,显存占用分布在 0%~5%,可以看到CUDA版本

参考资料

  1. 将Ollama应用程序安装至其他盘,同时模型下载到其他盘
  2. 设置Ollama模型跑在GPU上 (忽略里面需要安装CudaToolkit的部分)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/887917.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

让你搜索效率翻倍的技巧

本文是《最全面的浏览器教程》第五篇,介绍一些好用的搜索引擎技巧。​ 本文是《最全面的浏览器教程》第五篇,介绍一些好用的搜索引擎技巧。 上一篇文章推荐了很多好用的搜索引擎,但要用好它们,还得加上很多技巧:例如指定文件类型,排除某些内容,在指定域名内搜索等。 本文…

4. MySQL 逻辑架构说明

4. MySQL 逻辑架构说明 @目录4. MySQL 逻辑架构说明1. 逻辑架构剖析1.1 服务器处理客户端请求1.2 Connectors(连接器)1.3 第1层:连接层1.4 第2层:服务层1.5 第3层:引擎层1.6 存储层2. SQL执行流程2.1 MySQL 中的 SQL 执行流程2.2 MySQL8中SQL执行原理最后:1. 逻辑架构剖析…

无线充电

https://baijiahao.baidu.com/s?id=1809048563048631142&wfr=spider&for=pc 工信部放宽无线充电设备频率和功率限制,安卓厂商或加大无线充电功率,苹果则因Qi2.0标准频率与航空无线电导航业务冲突而调整。无线充电技术发展迅速,但仍需解决充电发热等问题。咱也就是说…

陪玩平台搭建,利用Redis实现多级缓存

陪玩平台搭建,利用Redis实现多级缓存如何使用redis6客户端缓存前置条件: redis服务端版本必须是>=6。lettuce版本>=6 目前java的redis客户端找了一圈,貌似只有lettuce 6支持,其他客户端估计后期会支持1、项目中pom引入lettuce GAV<dependency><groupId>i…

《DeepSeek中小学生/家长使用手册》让因材施教不再是选择题!

最近有受到粉丝私信如何在小初高的学习中使用DeepSeek来提供成绩;确实,随着教育改革的推进,学习内容日益丰富且难度加大,许多家长在辅导孩子和沟通交流方面感到困扰。无论是学生还是家长,找到合适的学习与辅导方式至关重要。尽管市面上有多种培训机构和学习工具可供选择,…

读DAMA数据管理知识体系指南01数据管理(上)

数据管理对企业至关重要,需规划、协作和领导力,确保数据质量和隐私,支撑企业决策和运营,数据是组织资产,需全生命周期管理,高质量数据带来竞争优势。1. 数据管理 1.1. 数据是一种至关重要的企业资产1.1.1. 数据和信息能使他们洞察顾客、产品和服务,帮助企业创新并实现其…

推荐几款开源且免费的 .NET MAUI 组件库

前言 今天大姚给大家推荐 3 款开源且免费的 .NET MAUI 组件库。 .NET MAUI介绍 .NET 多平台应用 UI (.NET MAUI) 是一个跨平台框架,用于使用 C# 和 XAML 创建本机移动和桌面应用。使用 .NET MAUI,可从单个共享代码库开发可在 Android、iOS、macOS 和 Windows 上运行的应用。.…

dotnet 在 VisualStudio 一键 F5 启动调试 Roslyn 分析器项目

本文将告诉大家如何在 VisualStudio 里面,一键使用习惯的 F5 键进行快速构建和启动调试 Roslyn 分析器项目在 dotnet 里面编写的 SourceGenerator 源代码生成器,或者是分析器时,可能编写的逻辑比较复杂,期望制作一个项目进行调试。或者是原本分析器能够跑得好好的,莫名就在…

dotnet OpenXML 已知问题 设置 0x0001 等 XML 不合法字符给到标题将在保存时抛出异常

本文记录 OpenXML 的已知问题,在 `PackageProperties.Title` 等属性上设置字符串包含如 Unicode 编码为 0x0001 等 XML 不合法字符,将在保存写入文件时,抛出 ArgumentException 异常此问题报告给了官方: https://github.com/dotnet/Open-XML-SDK/issues/1874 最简复现代码:…

区块链模型原理入门学习1——简易模型

区块链模型原理入门学习1——简易模型 最近抽空学习一下区块链的设计原理,正在搭建一个非常简易的模型,上生产的模型肯定复杂的多,不过学习还是由简入难,逐步深入才行,一口吃不成胖子。我使用的是C#编写的。区块链的特点:1.分布式记账,去中心化。2.挖矿是按照平台规则通…

python小技巧 收集

2的三次方:2**37除以3的整数商:7//3

VUE3 + Vite 编译部署后不报错,但显示空白页面

1、在 vite.config.js 中添加(ts版本则为 vite.config.ts)base: ./ 2、将路由模式改为 hash 模式history: createWebHashHistory() 3、注意检查路由文件需要由函数导入 (我的是未使用箭头函数导入,本地运行正常,但部署后无法正确加载路由,也不报错,找死人。。。)