把Ollama安装到D盘并使用NVIDIA GPU运行大模型-编程知识

把Ollama安装到D盘并使用NVIDIA GPU运行大模型

news/2025/2/22 9:44:33/文章来源:https://www.cnblogs.com/passacaglia/p/18730579

Ollama安装到D盘

.\OllamaSetup.exe /DIR="D:\Program Files\Ollama"

Ollama模型设置到D盘

添加环境变量
变量名：OLLAMA_MODELS
变量值：D:\ollama\models

让Ollama使用GPU

Ollama安装好后，为了让推理跑在GPU上，可以按照如下步骤设置环境变量：

变量名：OLLAMA_GPU_LAYER
变量值：cuda

如果需要指定特定的 GPU，可以添加以下环境变量：

变量名：CUDA_VISIBLE_DEVICES
变量值：GPU的UUID（按编号有时找不到，所以使用UUID）在控制台输入 nvidia-smi -L ，即可查看GPU的UUID

显卡相关

需要安装新版本的CUDA才能使用GPU（可能最小也得是CUDA 11 才行，我的原本是CUDA 10版的driver）

查看CUDA版本

nvidia-smi
或者桌面点右键，NVIDIA Control Panel，左下角 System Information，第二个选项卡 Components，3D Settings 第三行，NVCUDA64.DLL，NVIDIA CUDA 12.8.51 driver（代表是安装的12.8.51）【驱动更新之前是10.0的版本，运行ollama的时候，报下面的错误😂，估计是cuda版本太低】

The procedure entry point cuMemGetAllocationGranularity could not be located in the dynamic link library D:\Program Files\ollama\lib\runners\cuda_v11_avx\ggml_cuda_v11.dll.

用NVIDIA App来安装最新驱动

https://www.nvidia.cn/software/nvidia-app/
下载NVIDIA App，把显卡驱动更新到最新版

另外

CudaToolkit的安装包，不是必须的，只需要显卡驱动安装好，然后保证上面的版本最新就可以了

其他

ollama 常用指令

ollama ps 查看CPU/GPU使用情况
ollama list 查看已经下载的模型
ollama run xxxx 运行模型

nvidia 指令

利用指令 nvidia-smi查看Nvidia显存应用情况，显存占用分布在 0%~5%，可以看到CUDA版本

参考资料

将Ollama应用程序安装至其他盘，同时模型下载到其他盘
设置Ollama模型跑在GPU上（忽略里面需要安装CudaToolkit的部分）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/887917.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

让你搜索效率翻倍的技巧

本文是《最全面的浏览器教程》第五篇，介绍一些好用的搜索引擎技巧。本文是《最全面的浏览器教程》第五篇，介绍一些好用的搜索引擎技巧。上一篇文章推荐了很多好用的搜索引擎，但要用好它们，还得加上很多技巧：例如指定文件类型，排除某些内容，在指定域名内搜索等。本文…

4. MySQL 逻辑架构说明

4. MySQL 逻辑架构说明 @目录4. MySQL 逻辑架构说明1. 逻辑架构剖析1.1 服务器处理客户端请求1.2 Connectors(连接器)1.3 第1层：连接层1.4 第2层：服务层1.5 第3层：引擎层1.6 存储层2. SQL执行流程2.1 MySQL 中的 SQL 执行流程2.2 MySQL8中SQL执行原理最后：1. 逻辑架构剖析…

无线充电

https://baijiahao.baidu.com/s?id=1809048563048631142&wfr=spider&for=pc 工信部放宽无线充电设备频率和功率限制，安卓厂商或加大无线充电功率，苹果则因Qi2.0标准频率与航空无线电导航业务冲突而调整。无线充电技术发展迅速，但仍需解决充电发热等问题。咱也就是说…

陪玩平台搭建，利用Redis实现多级缓存

陪玩平台搭建，利用Redis实现多级缓存如何使用redis6客户端缓存前置条件： redis服务端版本必须是>=6。lettuce版本>=6 目前java的redis客户端找了一圈，貌似只有lettuce 6支持，其他客户端估计后期会支持1、项目中pom引入lettuce GAV<dependency><groupId>i…

《DeepSeek中小学生/家长使用手册》让因材施教不再是选择题！

最近有受到粉丝私信如何在小初高的学习中使用DeepSeek来提供成绩；确实，随着教育改革的推进，学习内容日益丰富且难度加大，许多家长在辅导孩子和沟通交流方面感到困扰。无论是学生还是家长，找到合适的学习与辅导方式至关重要。尽管市面上有多种培训机构和学习工具可供选择，…

读DAMA数据管理知识体系指南01数据管理（上）

数据管理对企业至关重要，需规划、协作和领导力，确保数据质量和隐私，支撑企业决策和运营，数据是组织资产，需全生命周期管理，高质量数据带来竞争优势。1. 数据管理 1.1. 数据是一种至关重要的企业资产1.1.1. 数据和信息能使他们洞察顾客、产品和服务，帮助企业创新并实现其…

dotnet 在 VisualStudio 一键 F5 启动调试 Roslyn 分析器项目

本文将告诉大家如何在 VisualStudio 里面，一键使用习惯的 F5 键进行快速构建和启动调试 Roslyn 分析器项目在 dotnet 里面编写的 SourceGenerator 源代码生成器，或者是分析器时，可能编写的逻辑比较复杂，期望制作一个项目进行调试。或者是原本分析器能够跑得好好的，莫名就在…

dotnet OpenXML 已知问题设置 0x0001 等 XML 不合法字符给到标题将在保存时抛出异常

本文记录 OpenXML 的已知问题，在 `PackageProperties.Title` 等属性上设置字符串包含如 Unicode 编码为 0x0001 等 XML 不合法字符，将在保存写入文件时，抛出 ArgumentException 异常此问题报告给了官方： https://github.com/dotnet/Open-XML-SDK/issues/1874 最简复现代码：…

区块链模型原理入门学习1——简易模型

区块链模型原理入门学习1——简易模型最近抽空学习一下区块链的设计原理，正在搭建一个非常简易的模型，上生产的模型肯定复杂的多，不过学习还是由简入难，逐步深入才行，一口吃不成胖子。我使用的是C#编写的。区块链的特点：1.分布式记账，去中心化。2.挖矿是按照平台规则通…

python小技巧收集

2的三次方：2**37除以3的整数商:7//3

VUE3 + Vite 编译部署后不报错，但显示空白页面

1、在 vite.config.js 中添加（ts版本则为 vite.config.ts）base: ./ 2、将路由模式改为 hash 模式history: createWebHashHistory() 3、注意检查路由文件需要由函数导入（我的是未使用箭头函数导入，本地运行正常，但部署后无法正确加载路由，也不报错，找死人。。。）