怎么在Windows操作系统部署阿里开源版通义千问(Qwen2)

news/2024/11/15 21:37:22/文章来源:https://www.cnblogs.com/kaigejava/p/18391855

怎么在Windows操作系统部署阿里开源版通义千问(Qwen2)

 |  原创作者/编辑:凯哥Java                            |  分类:人工智能学习系列教程

image.png

GitHub上qwen2截图

随着人工智能技术的不断进步,阿里巴巴通义千问团队近期发布了Qwen2系列开源模型,这一系列模型在多个领域展现出卓越的性能,特别是在自然语言理解、知识、代码、数学及多语言等能力上均显著超越当前领先的模型。本文将详细介绍如何在Windows操作系统上部署阿里开源版通义千问(Qwen2)模型,快速上手并体验这一强大的AI工具。

 

一、准备工作

在开始部署之前,请确保您的Windows系统满足以下要求:

1.     系统兼容性:确保您的Windows系统版本支持所需的软件安装。

2.     显卡驱动:如果您的计算机配备了独立显卡,请确保显卡驱动是最新的,以便更好地支持模型运行。

3.     硬盘空间:Qwen2模型文件较大,需要足够的硬盘空间来存储。

凯哥使用的电脑配置:

CPU:I7-12700F

内存:32GB

显卡:RTX3060 12G

image.png

cpu和内存

image.png

显卡

 

二、下载并安装Ollama

Ollama是一个用于运行大型AI模型的工具,支持多种模型格式,包括Qwen2。首先,您需要从Ollama的官方网站下载并安装Ollama。

  1. 访问Ollama官网:进入Ollama官网(https://ollama.com/download/windows)。

2.     下载并安装:点击“Download”按钮,选择Windows版本进行下载。下载完成后,按照提示进行安装。

这里凯哥就选择Windows版本的。

image.png

ollama官网下载页面

 

 

 

三、下载Qwen2模型

接下来,您需要从阿里通义千问的官方仓库下载Qwen2模型。

1.     访问官方教程:访问Qwen2官方教程(实际链接以官方提供为准)。

https://qwen.readthedocs.io/zh-cn/latest/

 

2.     选择适合的模型:根据您的硬件条件(如显卡显存大小),选择适合的Qwen2模型版本。在官方教程中,拉到最下面,可以看到效率评估。如下图:

image.png

找到效率评估

因为凯哥的显卡是12GB,所以凯哥选择Qwen2-7B-Instruct。如果你的显卡也是12GB,可以选择Qwen2-7B-Instruct版本。

image.png

Qwen2-7B-Instruct不同版本内存占用

凯哥使用的下载地址:https://modelscope.cn/models/qwen/Qwen2-7B-Instruct-GGUF/files

 

 

3.     下载模型文件:在官方教程中,找到模型下载链接,下载对应的.gguf文件。注意,模型文件可能包含多个精度版本(如q8、q16等),选择适合您需求的版本。

说明:

会看到不同的后缀,q”+ 用于存储权重的位数(精度)+ 特定变体,数字越大性能越强。

数字越大,精度越高,k是在所有的attention和feed_forward张量上将精度提升2位,m是在一半的attention和feed_forward张量上将精度提升2位。

根据自己的需求选择模型,凯哥这里直接选了q8。

image.png

凯哥选择的q8

 

四、部署Qwen2模型

下载完模型文件后,您可以使用Ollama来部署Qwen2模型。

1.     创建模型文件:在Windows上创建一个新文件夹(例如命名为“qwen”),将下载的.gguf文件放入该文件夹中。然后,在该文件夹内创建一个名为“Modelfile”的文本文件,内容填写为:

FROM ./qwen2-7b-instruct-q8_0.gguf

 

注意替换文件名以匹配您下载的模型文件。

2.     使用Ollama创建模型:打开命令行工具(如CMD或PowerShell),切换到包含Modelfile的文件夹。运行以下命令来创建Qwen2模型:

 

image.png

模型创建成功

如果显示“success”,则表示模型创建成功。

3.     运行模型:创建成功后,您可以通过以下命令来运行模型:

ollama run Qwen2-7B

 

此时,您应该能看到一个对话框或命令行界面,您可以在这里输入文本与模型进行交互。

image.png

命令行输入文案地方

在这里输入:你是谁?看看模型怎么交互的。

可以看到模型交互如下:

image.png

模型交互效果

补充说明:
如果要看本地有哪些大模型:ollama list

如果要删除这个模型的话:ollama rm xxx

如果要看运行了哪些大模型:ollama ps

运行结果:

image.png

运行效果

 

五、在Web界面中运行Qwen2

虽然直接在命令行中运行模型很方便,但为了获得更好的用户体验,您可以将Qwen2模型集成到Web界面中。

1.     安装Node.js

首先,需要在Windows上安装Node.js。访问Node.js官网,下载并安装最新版本的Node.js。

凯哥使用的是版本号是18.6

image.png

凯哥本地node版本

 

2.     下载ollama-webui

从GitHub或其他源下载ollama-webui的代码。

https://github.com/ollama-webui/ollama-webui-lite

 

3.     设置并启动Web界面

按照ollama-webui的文档说明,设置Node.js环境,安装依赖,并启动Web服务器。然后,在浏览器中打开Web页面,选择您的Qwen2模型即可开始对话。

3.1镜像提速:

入ollama-webui文件夹,设置国内镜像源提速:

npm config set registry http://mirrors.cloud.tencent.com/npm/

 

3.2 安装依赖

npm install

 

错误解决办法:

如果报错说要audit,则依次进行即可:

npm auditnpm audit fix

 

image.png

启动

3.3 启动Web界面:

命令执行完成就可以用看到如下图的访问地址:

image.png

启动成功输出访问地址

打开Web页面,选择你的模型即可开始对话:

image.png

访问页面

通过web和模型进行交互:

我们依然输入:你是谁?

image.png

在web也没和模型交互效果

好了,至此,你就可以在自己电脑上和模型进行对话了。

大家好:我是凯哥Java(kaigejava),如果大家感兴趣,可以一起学学AI。

 

六、总结

 

通过以上步骤,您可以在Windows操作系统上成功部署阿里开源版通义千问(Qwen2)模型,并通过命令行或Web界面与模型进行交互。Qwen2系列模型凭借其卓越的性能和广泛的应用场景,将为您的AI项目提供强大的支持。

希望本文能帮助您顺利部署阿里开源版通义千问模型,享受AI技术带来的便利与乐趣。如有任何疑问,请随时查阅官方文档或寻求技术支持。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/790720.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Web刷题之polarctf靶场(1)

PolarCTF 1.XFF打开靶场发现需要ip为1.1.1.1的用户才行, 打开BurpSuite进行抓包并对数据包进行修改,根据题目XFF提示flag{847ac5dd4057b1ece411cc42a8dca4b7}对此题所考察的知识进行一个扩展(对于构造本地用户语句) X-Forwarded-For:127.0.0.1X-Forwarded:127.0.0.1Forwarded-F…

广受欢迎文档管理系统有哪些?这10款不容错过

比较好用的 10 款文档管理系统推荐:PingCode、Worktile、语雀、联想Filez企业网盘、360亿方云、DocuPhase 、M-Files 、LogicalDOC、Revver、Box。在现代企业环境中,管理大量文档和数据往往让人头疼。不仅需要维护信息的更新和可访问性,还要确保安全和遵守法规。这使得选择一…

Web刷题之polarctf靶场

PolarCTF 1.XFF打开靶场发现需要ip为1.1.1.1的用户才行, 打开BurpSuite进行抓包并对数据包进行修改,根据题目XFF提示flag{847ac5dd4057b1ece411cc42a8dca4b7}对此题所考察的知识进行一个扩展(对于构造本地用户语句) X-Forwarded-For:127.0.0.1X-Forwarded:127.0.0.1Forwarded-F…

丽水人社公需科目刷课脚本-JavaScript编写

脚本 学习网站:rlzy.lshrss.cn/Service/Index 脚本地址:丽水市专业技术人员继续教育公需科目-刷课脚本 教程 1.插件安装(以Microsoft Edge浏览器为例)打开最中间那个蓝色绿色的浏览器,谷歌之类的浏览器也可以点击屏幕右上角三个点,图示位置,然后点击扩展点击获取扩展搜索…

【工具分享】红队重点资产指纹识别 -- P1finger -0.02(最新版本)

工具介绍: P1finger 红队行动下的重点资产指纹识别工具。P1finger 是一个重点资产指纹识别的工具,旨在通过HTTP请求特征来识别目标系统。其主要特点包括: 语言和实现: 语言:使用Go语言(Golang)实现。 目的:强调跨平台能力和易于集成。 指纹库和检测策略: 指纹库:通过…

四川省专业技术人员继续教育网刷课脚本-JavaScript编写

脚本 学习网站:四川省专业技术人员继续教育网 edu.scjxjypx.com/ 脚本地址: chinahrt.com-刷课脚本 教程 1.插件安装(以Microsoft Edge浏览器为例)打开最中间那个蓝色绿色的浏览器,谷歌之类的浏览器也可以点击屏幕右上角三个点,图示位置,然后点击扩展点击获取扩展搜索T…

Kafka事务实现原理

1 Kafka的事务 V.S RocketMQ RocketMQ事务主要解决问题:确保执行本地事务和发消息这俩操作都成功/失败。RocketMQ还有事务反查机制兜底,更提高事务执行的成功率和数据一致性。 而Kafka事务,是为确保在一个事务中发送的多条消息,要么都成功,要么都失败。 这里的多条消息不一…

德州市专业技术人员继续教育刷课脚本-JavaScript编写

脚本 学习网站:德州市专业技术人员继续教育服务平台: sddz.yxlearning.com 脚本地址:德州市专业技术人员继续教育服务平台-刷课脚本 教程 1.插件安装(以Microsoft Edge浏览器为例)打开最中间那个蓝色绿色的浏览器,谷歌之类的浏览器也可以点击屏幕右上角三个点,图示位置,…

威海市专业技术人员继续教育刷课脚本-JavaScript编写

脚本 学习网站:sdwh.yxlearning.com,rsjwhjxjy.weihai.cn 脚本地址:威海市专业技术人员继续教育-刷课脚本 教程 1.插件安装(以Microsoft Edge浏览器为例)打开最中间那个蓝色绿色的浏览器,谷歌之类的浏览器也可以点击屏幕右上角三个点,图示位置,然后点击扩展点击获取扩展…

C# 绘制曲线的ScottPlot.NET

ScottPlot 是一个免费的开源 .NET 绘图库,可以轻松交互式地显示大型数据集。折线图、条形图、饼图、散点图等只需几行代码即可创建。 ScottPlot - .NET 的交互式绘图库ScottPlot 4.1 Demo 官方的demo是最好的学习例程 解压后的文件清单如下, 双击 ScottPlot.Demo.WinForms.…

Docker环境搭建以及常见问题

Docker环境搭建 主机环境要求在ubuntu16_20之间 Docker安装和卸载 apt安装方式 # 旧版本的docker sudo apt install docker.io sudo apt-get purge docker.io sudo rm -rf /var/lib/docker sudo rm -rf /var/lib/containerd官方安装方式 # 首先安装一些依赖包,使得能够通过HTT…

容器存储接口--CSI

目录一、背景二、CSI 是什么三、CSI 系统架构1、CSI 如何与 k8s 组件相互通信2、CSI 由哪些组件组成3、CSI 的工作原理4、k8s 存储中涉及的组件及其作用4.1、Sidecar Containers4.1.1、external-attacher4.1.2、external-provisioner4.1.3、external-resizer4.1.4、external-sn…