大模型部署 工具 ollama | AIGC

news/2025/1/25 2:37:00/文章来源:https://www.cnblogs.com/o-O-oO/p/18688827

Ollama是一个集成了多种大型语言模型的工具,它支持模型的部署、运行以及API的整合和调用。
Ollama为不同操作系统的用户提供了便捷的安装方式,并具备丰富的命令行界面(CLI)和API接口,使得用户可以轻松地管理和运行大型模型。

一、安装

Ollama的安装方式因操作系统而异,以下是主要操作系统的安装步骤:

1.1 macOS

【安装Homebrew(如果尚未安装)】:

打开终端,输入以下命令安装

Homebrew:/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

【安装Ollama】:

在终端中输入命令进行安装:

brew install ollama

【验证安装】:

安装完成后,可以通过输入ollama --version来验证Ollama是否安装成功。

1.2 Windows

【下载安装包】:

访问Ollama的官方网站,下载适用于Windows的安装包。

【运行安装包】:

双击下载的安装包,按照提示完成安装。默认安装路径通常为

C:\Users\{你的电脑账户名}\AppData\Local\Programs\Ollama

【配置环境变量】(如遇到ollama命令无法使用的情况):

控制面板 ⏩系统 ⏩ 高级系统设置 ⏩ 环境变量 ⏩ 在系统变量中找到Path ⏩ 编辑 ⏩ 新建,添加Ollama的安装路径。

【验证安装】:

打开命令提示符,输入ollama --version来验证安装是否成功。

1.3 Linux

【更新包列表】(以Debian/Ubuntu为例):

打开终端,输入sudo apt-get update命令。

【安装Ollama】:

输入命令进行安装

curl -fsSL https://ollama.com/install.sh | sh

【验证安装】:

输入ollama --version来验证安装是否成功。

二、启动

Ollama的启动可以通过命令行完成,使用ollama serve或其别名serve、start命令即可启动Ollama服务。
Ollama将自动处理模型的加载和配置,无需用户手动干预。

也可以通过sudo systemctl start ollama, 具体的启动service

# /etc/systemd/system/ollama.service
[Unit]
Description=Ollama Service
After=network-online.target[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3[Install]
WantedBy=default.target

三、常用命令

Ollama提供了丰富的命令行工具,以下是一些常用命令:

启动Ollama服务:ollama serve

从模型文件创建模型:ollama create [模型名称] -f [模型文件路径]

显示模型信息:ollama show [模型名称]

运行模型:ollama run [模型名称] [输入文本]

从注册表中拉取模型:ollama pull [模型名称]

将模型推送到注册表:ollama push [模型名称]

列出所有模型:ollama list

复制模型:ollama cp [源模型名称] [目标模型名称]

删除模型:ollama rm [模型名称]

获取帮助信息:ollama help

特别的,可以通过ollama ps查看模型运行负载情况

ollama psNAME          ID              SIZE     PROCESSOR    UNTIL
llama3:70b    bcfb190ca3a7    42 GB    100% GPU     4 minutes from now

可以通过ollama run qwen2:70b 来下载模型和启动CLI

模型默认在

macOS: ~/.ollama/models

Linux: /usr/share/ollama/.ollama/models

Windows: C:\Users%username%.ollama\models

四、接口API使用

ollama run模型后会启动一个http服务: localhost:11434,可以通过prompt和chat方式和大模型进行交互

curl http://localhost:11434/api/generate -d '{"model": "qwen2:70b","prompt":"Why is the sky blue?"
}'curl http://localhost:11434/api/chat -d '{"model": "llama3.1","messages": [{ "role": "user", "content": "why is the sky blue?" }]
}

ollama也提供了openai式的接口

from openai import OpenAIclient = OpenAI(base_url='http://localhost:11434/v1/',# required but ignoredapi_key='ollama',
)chat_completion = client.chat.completions.create(messages=[{'role': 'user','content': 'Say this is a test',}],model='llama3',
)response = client.chat.completions.create(model="llava",messages=[{"role": "user","content": [{"type": "text", "text": "What's in this image?"},{"type": "image_url","image_url": "",},],}],max_tokens=300,
)completion = client.completions.create(model="llama3",prompt="Say this is a test",
)list_completion = client.models.list()model = client.models.retrieve("llama3")embeddings = client.embeddings.create(model="all-minilm",input=["why is the sky blue?", "why is the grass green?"],
)

五、支持模型

ollama支持绝大多数开源大模型和一些多模态模型

更全的参考

https://ollama.com/library

个人观点,仅供参考

原创 WedO实验君 人工智能微客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/874945.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深入探讨索引的创建与删除:提升数据库查询效率的关键技术

title: 深入探讨索引的创建与删除:提升数据库查询效率的关键技术 date: 2025/1/25 updated: 2025/1/25 author: cmdragon excerpt: 在数据量猛增的今天,如何有效地从庞大的数据库中快速获取所需信息,已成为数据库管理的一个重要课题。索引作为一种有效的数据结构,能够大幅…

【模拟电子技术】13-H参数等效模型

【模拟电子技术】13-H参数等效模型 我们已经知道在不同的静态工作点下,即使给三极管相同的的Ib,得到的Ic也会不同,引出H参数等效模型在第07节中有一张这样的图我们可以看出IB与UBE和UCE都有关,注意这里的真正的物理原因,UCE大到一定程度时候,从发射极到集电极的电子会饱和…

25.1.24小记

今天因为打美赛的原因,全天都比较忙,只能抽出晚上的一点点时间随便听一听课。(美赛第一天进度还算客观) 包(package) 当要用到类的时候,需要给出全名(即package.class) 举个例子 :其中包clock中包含Clock类,包display中包含display类 1.在package中的class开头必须写…

极空间避坑指南 - 苹果 Live Photo 备份后成静态图

背景 最近入手了一款新 NAS:极空间 Z40Pro,准备用作家里人的相册备份和影音中心。 折腾的过程以后有机会单独聊一聊,这篇文章主要是为了避免极空间用户踩坑。 问题说明 当使用极空间 NAS 备份 iPhone 的 Live Photo 数据之后,如果你有冷备份或者想换硬盘的情况下,贸然把备…

RocketMQ原理—3.源码设计简单分析下

大纲 1.Producer作为生产者是如何创建出来的 2.Producer启动时是如何准备好相关资源的 3.Producer是如何从拉取Topic元数据的 4.Producer是如何选择MessageQueue的 5.Producer与Broker是如何进行网络通信的 6.Broker收到一条消息后是如何存储的 7.Broker是如何实时更新索引文件…

数据库:推荐一款非常实用的数据库定时备份工具,大神必备(附下载)!

今天给大家推荐推荐一款非常实用的数据库定时备份工具,大神必备! 一、SQLBackupAndFTP 是什么? SQLBackupAndFTP 是一款用于备份 SQL Server、MySQL 和 PostgreSQL Server 数据库的实用软件,执行定期的完整备份、差异备份和事务日志备份,备份完成后产生的备份压缩包文件可…

【模拟电子技术】12-放大电路的分析方法

【模拟电子技术】12-放大电路的分析方法 分析交流时候,必须先分析直流,因为交流电路中的等效电阻与静态工作点相关。于是需要分析直流通路。交流电源置零,电容视为断路静态的所有问题都可以在直流通路中找到。 后分析交流通路。直流电源置零,交流通路频率高,容抗小,电容视…

【开源】推荐一款JAVA开源的大数据用户行为分析平台

一、项目简介 随着大数据技术的迅猛发展,其在商业领域的应用日益广泛,并为企业创造了显著的价值。通过深入的数据分析来洞悉用户行为模式,构建以用户体验为核心的高效增长策略,已成为现代企业不可或缺的核心竞争力之一。面对不断攀升的成本压力,企业必须摒弃传统的粗犷营销…