llama.cpp运行qwen0.5B-编程知识

llama.cpp运行qwen0.5B

news/2025/1/12 22:54:52/文章来源:https://blog.csdn.net/qq_36437991/article/details/137248622

编译llama.cp

参考

下载模型

05b模型下载

转化模型

创建虚拟环境

conda create --prefix=D:\miniconda3\envs\llamacpp python=3.10
conda activate D:\miniconda3\envs\llamacpp

安装所需要的包

在这里插入图片描述

cd G:\Cpp\llama.cpp-master
pip install -r requirements.txt
python convert.py -h

在这里插入图片描述

执行转换命令

python convert.py G:\Python\Qwen1.5-0.5B-Chat --outfile G:\Cpp\qwenchat0.5b.gguf --outtype q8_0
python convert-hf-to-gguf.py G:\Python\Qwen1.5-0.5B-Chat  --outfile G:\Cpp\qwenchat0.5b.gguf
# 解释
# python 
# convert.py # convert.py路径
# /content/finetuned-2_merged # 模型路径
# --outfile finetuned-2.gguf # 要分配的gguf模型名称
# --outtype q8_0 #以8 Bit量化

在这里插入图片描述

将模型量化为5Bit（使用q5_k-m方法）

quantize.exe G:\Cpp\qwenchat0.5b.gguf qwenchat0.5b-q5_k_m.gguf q5_k_m

在这里插入图片描述

运行

# 注意Qwen模型要使用chatml prompt 模版
main.exe -m qwenchat0.5b-q5_k_m.gguf -n 512 --chatml

在这里插入图片描述

尝鲜通义千问1.8B
参考
hf2gguf

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/588882.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

2-PS修改图片颜色

【问题介绍】PS 快速改变图片颜色，可以生成一个系列的可爱作品如下图，一个可爱的白色云朵蓝色背景蓝白色冰淇淋如果我们想要改一改颜色，做出一个系列的绿色冰淇淋、粉色冰淇淋呢？ 方法1 【最简单】图像→替换颜色调整后效果…

Rust vs C++：2024，谁更懂错误处理？

讲动人的故事，写懂人的代码「席双嘉，听说你的C++项目又因为忘了检查返回值导致内存泄漏，又加班了？」周五中午，在国内某科技巨头熙熙攘攘的员工餐厅，贾克强半开玩笑地戳了戳坐在隔壁的席双嘉，眼神中满是戏谑。贾克强，一个热衷于Rust的程序员，总是乐于挑战和探索新…

网站保安大作战：HTML代码加固技术攻略

引言 HTML是网站开发的基础语言，它的安全性直接关系到网站的安全性。为了保障网站的安全性，我们需要加固HTML代码。本文将介绍一些具体方法，帮助你加固HTML代码，提高网站的安全性。摘要本文将介绍以下几种方法来加固HTML代码…

36.not comply with the UI component syntax不允许在UI描述里直接使用

不允许在UI描述里直接使用，但可以在方法或者函数里使用 not comply with the UI component syntax. <etsLint> 这里ok:

商标撤销，华为还能“遥遥领先“吗？

华为不再"遥遥领先"? 去年 9 月，华为技术有限公司申请注册两枚「遥遥领先」商标，国际分类为「科学仪器」和「运输工具」。今年 1 月 20 日，商标流程信息显示，上述两枚商标被撤回注册申请，当前为无效状态。…

openGauss学习笔记-254 openGauss性能调优-使用Plan Hint进行调优-子链接块名的hint

文章目录 openGauss学习笔记-254 openGauss性能调优-使用Plan Hint进行调优-子链接块名的hint254.1 功能描述254.2 语法格式254.3 参数说明254.4 示例 openGauss学习笔记-254 openGauss性能调优-使用Plan Hint进行调优-子链接块名的hint 254.1 功能描述指明子链接块的名称。…

根据用户角色权限，渲染菜单的一个问题记录

个人博客：无奈何杨（wnhyang） 个人语雀：wnhyang 共享语雀：在线知识共享 Github：wnhyang - Overview 背景之前一直讲过自己独立在做一个中后台管理系统，当然这个只是开始，未来会基…

IP地址如何修改？分享操作技巧

在互联网世界中，IP地址是每台计算机或网络设备的唯一标识，它决定了设备在网络中的位置以及与其他设备的通信方式。然而，有时出于特定需求，我们可能需要修改设备的IP地址。虎观代理将详细阐述如何修改IP地址，并探讨在修…

通过nvtx和Nsight Compute分析pytorch算子的耗时

通过nvtx和Nsight Compute分析pytorch算子的耗时一.效果二.代码本文演示了如何借助nvtx和Nsight Compute分析pytorch算子的耗时一.效果第一次执行,耗时很长小规模的matmul,调度耗时远大于算子本身大规模的matmul,对资源的利用率高小规模matmul,各层调用的耗时二.代码…

RuntimeError: Error compiling objects for extension虚拟环境和系统环境——添加、删除、修改环境变量

前言：因为一个报错RuntimeError: Error compiling objects for extension 没有配置cl.exe环境变量，我的应用场景是需要搞定虚拟环境变量配置 RuntimeError: Error compiling objects for extension手把手带你解决（超详细）-CSDN博…

RJ61BT11 三菱iQ-R系列CC-Link系统主站/本地站模块

RJ61BT11 三菱iQ-R系列CC-Link系统主站/本地站模块 RJ61BT11参数说明：CC-Link Ver.2版本，主站/本地站三菱iQ-R系列CC-Link系统主站/本地站模块RJ61BT11产品规格： [传送速度] 156K/625K/2.5M/5M/l0Mbps(可选) [最多连接个数(主站时)] 64个 …

Vue项目中引入外部字体文件

1、导入字体文件（ .ttf格式） 1.下载相应的字体文件，或者找ui设计师要一份。一般字体文件使用 .ttf 格式的即可。将准备好的字体文件，放在项目中，文件目录示例如下： 2.创建一个font.css文件用于定义这个字…