本地通过python运行AI大语言模型LLaMa2-编程知识

本地通过python运行AI大语言模型LLaMa2

news/2024/11/18 3:42:25/文章来源:https://www.cnblogs.com/henkenen/p/18356679

什么是Llama2

Llama 全称 large language model, Meta AI 公司2023年发布的开源AI大型语言模型，参数7B~65B。最新版本为Llama 3。更为详细的介绍可参考，LLaMA - 维基百科，自由的百科全书 (wikipedia.org) 。

什么是llama.cpp?

一个开源c++库，用c++重写了LLaMa的推理代码，可用于加载运行LLaMa语言模型，极大的降低了对硬件的要求。 Git 仓库地址： GitHub - ggerganov/llama.cpp: LLM inference in C/C++

本地运行大模型准备：

pip install llama-cpp-python , 作为参考，我本地安装运行的版本为0.2.87
从Hugging Face上下载一个已经训练好的模型文件到本地，作为参考，我下载的是zephyr-7b-beta.Q4_0.gguf 这个模型

TheBloke/zephyr-7B-beta-GGUF at main (huggingface.co)

3.代码示例及运行结果：

运行以下python脚本，即可基于promt得到模型的输出。

祝运行顺畅。

拓展阅读：一文为你深度解析LLaMA2模型架构_人工智能_华为云开发者联盟_InfoQ写作社区

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/783219.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Python一些提高效率的类库和装饰器用法

Python一些提高效率的类库和装饰器用法

本文主要是慢慢积累Python中一些能提高效率的类库和装饰器，闲话少说，开始进入主题。装饰器装饰器是一种设计模式，用于修改或增强函数、方法或类的行为，而不需要改变其本身的代码。Python中的装饰器通常用@符号和函数来实现。# 自己编写的装饰器 def my_decorator(func):d…

阅读更多...

使用 `dd` 备份Ubuntu系统盘

使用 `dd` 备份Ubuntu系统盘

1. 方案概述 dd 是一个低级别的数据复制工具，能够直接将磁盘或分区的内容逐位复制到另一个设备或文件中。使用 dd 备份系统盘可以获得整个系统的精确副本，包括操作系统、配置文件、已安装的软件、以及所有用户数据。 2. 前提条件源设备：包含系统的磁盘（如 /dev/sda）目标设…

阅读更多...

淘宝直播自动回复评论 - 浏览器插件

淘宝直播自动回复评论 - 浏览器插件

功能介绍浏览器插件源码开放，可以随意二次开发，无时间限制，无账号限制，无电脑限制实现原理，纯浏览器插件实现，监控浏览器界面元素变动，获取直播间或者直播中控后台的评论文本，匹配回复关键词或调用AI接口，再利用js模拟输入和点击等操作支持以下中控台或直播间地址，…

阅读更多...

QC_操作

QC_操作

场景1. MINUS2 如：百乐Step1，q28<>可擦中性笔 →q14使用中性笔 (7) 删除排除样本(OMIT)

阅读更多...

【日记】酸奶冻成冰块了 QvQ（457 字）

【日记】酸奶冻成冰块了 QvQ（457 字）

正文我不知道一楼的冷藏柜已经修好了，早知道我就把酸奶放一楼了。放在六楼，现在酸奶已经冻成冰块了……今天基本上一整天都在摸鱼看书，中午把经济师报名了，报名费 122 块。有点贵……昨天给全家上了一个 10 万的意外险，包含医疗责任，一共 200 多块钱。但是似乎没办法给兄…

阅读更多...

Codeforces Round 903 (Div. 3) F. Minimum Maximum Distance

Codeforces Round 903 (Div. 3) F. Minimum Maximum Distance

https://codeforces.com/contest/1881/problem/F不难发现一件事情，我们这里最后的答案所在的点是 1 和 3 号点。我们有没有发现一个性质：就是这两个点都是红点间的路径上的，而且最后的答案就是最长的红点间的距离的长度除以二上取整。那么，我们怎么找到最长的红点间的距离…

阅读更多...

apifox进行https接口测试

apifox进行https接口测试

SSL双向认证-SpringBoot项目_apifox 添加证书-CSDN博客说是 SSL 证书验证开启，可能验证不通过，根据实际情况来单向认证，客户端证书就不必上传了注：这里我上传的是p12证书，所以选择下图所示上传另外，这里用的是rsa2048，SM2试了，貌似有问题，如果只是简单的get，可以考…

阅读更多...

docker 构建java 部署包

docker 构建java 部署包

去官网查找对应的镜像资源。建议最好选择官方的镜像，避免出现一些奇奇怪怪的问题。由于JDK8现在开始收费，因此只能使用OpenJDK的镜像。.1.拉取Java镜像. docker pull java:openjdk-82.运行java容器。 a.先创建一个Java目录：mkdir /app/zh_lawsuit_oracle/ b.在本地准备一…

阅读更多...

Odoo17 门户链接访问令牌

Odoo17 门户链接访问令牌

为了方便共享文档，odoo在每个文档模型中都加入了共享链接的快捷分享功能，用户可以方便的在想要分享的文档上将文档的链接分享给客户/供应商。我们以销售订单为例，来看一下分享功能的使用方法. 生成共享链接我们在想要分享的文档上点击动作-分享，会弹出一个对话框：在显示的…

阅读更多...

USB硬件特性（速度、名称、供电）

USB硬件特性（速度、名称、供电）

USB传输速度 USB1.0版本，USB LS(Low Speed低速)，速度1.5Mbps。 USB1.1版本，USB FS(Full Speed全速)，速度12Mbps。 USB2.0版本，USB HS(High Speed高速)，速度480Mbps。 USB3.0版本，USB SS(Super Speed超速)，速度5Gbps。 USB3.1版本，USB SS(Super Speed超速)，速度10Gbps…

阅读更多...

wpf 如何写一个圆形的进度条

wpf 如何写一个圆形的进度条

先看一下效果吧调用代码如下<local:CycleProgressBar Width="100" Height="100" Background="#FFF68986" Foreground="#FFFA1F09"Maximum="100" Minimum="0" Value="20" IsIndeterminate="Fals…

阅读更多...

与LLMs进行在IDE中直接、无需提示的交互是工具构建者探索的一个有希望的未来方向

与LLMs进行在IDE中直接、无需提示的交互是工具构建者探索的一个有希望的未来方向

这个观点在卡内基梅隆大学与谷歌研究人员合作文章《Using an LLM to Help With Code Understanding》中提出。这个观点在卡内基梅隆大学与谷歌研究人员合作文章《Using an LLM to Help With Code Understanding》中提出。论文地址：https://dl.acm.org/doi/abs/10.1145/3597…

阅读更多...

推荐文章

最新文章