本地通过python运行AI大语言模型LLaMa2

news/2024/11/18 3:42:25/文章来源:https://www.cnblogs.com/henkenen/p/18356679

什么是Llama2

Llama 全称 large language model,  Meta AI 公司2023年发布的开源AI大型语言模型,参数7B~65B。最新版本为Llama 3。 更为详细的介绍可参考,LLaMA - 维基百科,自由的百科全书 (wikipedia.org) 。

什么是llama.cpp?

一个开源c++库,用c++重写了LLaMa的推理代码,可用于加载运行LLaMa语言模型,极大的降低了对硬件的要求。  Git 仓库地址: GitHub - ggerganov/llama.cpp: LLM inference in C/C++

 

本地运行大模型准备:

  1. pip install llama-cpp-python     , 作为参考,我本地安装运行的版本为0.2.87
  2. 从Hugging Face上下载一个已经训练好的模型文件到本地 ,作为参考,我下载的是zephyr-7b-beta.Q4_0.gguf 这个模型

 

TheBloke/zephyr-7B-beta-GGUF at main (huggingface.co)

3.代码示例及运行结果:

运行以下python脚本,即可基于promt得到模型的输出。

 

祝运行顺畅。

 

 

拓展阅读:一文为你深度解析LLaMA2模型架构_人工智能_华为云开发者联盟_InfoQ写作社区

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/783219.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python一些提高效率的类库和装饰器用法

本文主要是慢慢积累Python中一些能提高效率的类库和装饰器,闲话少说,开始进入主题。 装饰器 装饰器是一种设计模式,用于修改或增强函数、方法或类的行为,而不需要改变其本身的代码。Python中的装饰器通常用@符号和函数来实现。# 自己编写的装饰器 def my_decorator(func):d…

使用 `dd` 备份Ubuntu系统盘

1. 方案概述 dd 是一个低级别的数据复制工具,能够直接将磁盘或分区的内容逐位复制到另一个设备或文件中。使用 dd 备份系统盘可以获得整个系统的精确副本,包括操作系统、配置文件、已安装的软件、以及所有用户数据。 2. 前提条件源设备:包含系统的磁盘(如 /dev/sda) 目标设…

淘宝直播自动回复评论 - 浏览器插件

功能介绍 浏览器插件源码开放,可以随意二次开发,无时间限制,无账号限制,无电脑限制 实现原理,纯浏览器插件实现,监控浏览器界面元素变动,获取直播间或者直播中控后台的评论文本,匹配回复关键词或调用AI接口,再利用js模拟输入和点击等操作 支持以下中控台或直播间地址,…

QC_操作

场景1. MINUS2 如:百乐Step1,q28<>可擦中性笔 →q14使用中性笔 (7) 删除 排除样本(OMIT)

【日记】酸奶冻成冰块了 QvQ(457 字)

正文我不知道一楼的冷藏柜已经修好了,早知道我就把酸奶放一楼了。放在六楼,现在酸奶已经冻成冰块了……今天基本上一整天都在摸鱼看书,中午把经济师报名了,报名费 122 块。有点贵……昨天给全家上了一个 10 万的意外险,包含医疗责任,一共 200 多块钱。但是似乎没办法给兄…

Codeforces Round 903 (Div. 3) F. Minimum Maximum Distance

https://codeforces.com/contest/1881/problem/F不难发现一件事情,我们这里最后的答案所在的点是 1 和 3 号点。 我们有没有发现一个性质:就是这两个点都是红点间的路径上的,而且最后的答案就是最长的红点间的距离的长度除以二上取整。 那么,我们怎么找到最长的红点间的距离…

apifox进行https接口测试

SSL双向认证-SpringBoot项目_apifox 添加证书-CSDN博客 说是 SSL 证书验证 开启,可能验证不通过,根据实际情况来单向认证,客户端证书就不必上传了注: 这里我上传的是p12证书,所以选择下图所示上传另外,这里用的是rsa2048,SM2试了,貌似有问题,如果只是简单的get,可以考…

docker 构建java 部署包

去官网查找对应的镜像资源。 建议最好选择官方的镜像,避免出现一些奇奇怪怪的问题。由于JDK8现在开始收费,因此只能使用OpenJDK的镜像。.1.拉取Java镜像. docker pull java:openjdk-82.运行java容器。 a.先创建一个Java目录 :mkdir /app/zh_lawsuit_oracle/ b.在本地准备一…

Odoo17 门户链接访问令牌

为了方便共享文档,odoo在每个文档模型中都加入了共享链接的快捷分享功能,用户可以方便的在想要分享的文档上将文档的链接分享给客户/供应商。我们以销售订单为例,来看一下分享功能的使用方法. 生成共享链接 我们在想要分享的文档上点击动作-分享,会弹出一个对话框:在显示的…

USB硬件特性(速度、名称、供电)

USB传输速度 USB1.0版本,USB LS(Low Speed低速),速度1.5Mbps。 USB1.1版本,USB FS(Full Speed全速),速度12Mbps。 USB2.0版本,USB HS(High Speed高速),速度480Mbps。 USB3.0版本,USB SS(Super Speed超速),速度5Gbps。 USB3.1版本,USB SS(Super Speed超速),速度10Gbps…

wpf 如何写一个圆形的进度条

先看一下效果吧调用代码如下<local:CycleProgressBar Width="100" Height="100" Background="#FFF68986" Foreground="#FFFA1F09"Maximum="100" Minimum="0" Value="20" IsIndeterminate="Fals…

与LLMs进行在IDE中直接、无需提示的交互是工具构建者探索的一个有希望的未来方向

这个观点在卡内基梅隆大学与谷歌研究人员合作文章《Using an LLM to Help With Code Understanding》中提出。这个观点在卡内基梅隆大学与谷歌研究人员合作文章 《Using an LLM to Help With Code Understanding》 中提出。 论文地址:https://dl.acm.org/doi/abs/10.1145/3597…