RHEL8部署baichuan2环境

前置

1、安装NVIDIA驱动

https://www.nvidia.cn/Download/index.aspx?lang=cn
阿里云 Alibaba Cloud Linux 3.2104 LTS 64位,需要选择RHEL8,如果没有RHEL8,则选最下面那个选择所有操作系统
在这里插入图片描述

  • 点击搜索,下载这里有安装步骤,记得要看,每个版本安装方式可能不一样
    加粗样式

  • 点击下载到这里复制下载链接
    在这里插入图片描述

  • 安装后校验

# nvidia-smi
  • 输出如下信息表示安装成功,CUDA Version: 12.2需要大于等于后面安装的cuda驱动12.1
    在这里插入图片描述

2、安装 cuda 11.7

参考:https://developer.nvidia.com/cuda-11-7-0-download-archive?target_os=Linux&target_arch=x86_64&Distribution=RHEL&target_version=8&target_type=runfile_local

wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda_11.7.0_515.43.04_linux.run
chmod +x cuda_11.7.0_515.43.04_linux.run
sudo sh cuda_11.7.0_515.43.04_linux.run

安装完成后设置环境变量

export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64

测试

nvcc -V

在这里插入图片描述

3、安装anaconda

下载脚本并执行

wget https://repo.anaconda.com/archive/Anaconda3-5.3.0-Linux-x86_64.sh

创建虚拟环境并激活

创建:conda create -n baichuan2 python=3.10
激活:conda activate baichuan2
取消激活:conda deactivate

4、下载模型

https://aliendao.cn/models/baichuan-inc/Baichuan2-7B-Chat-4bits#/

使用wget一个个下,拼接文件路径
http://61.133.217.142:20800/download/models/baichuan-inc/Baichuan2-7B-Chat-4bits/tokenizer.model

安装环境

1、克隆源代码

 git clone https://github.com/baichuan-inc/Baichuan2.git

2、安装依赖

cd Baichuan2
pip install -r requirements.txt

测试

python
import torch
print(torch.__version__)
torch.cuda.is_available()

3、安装量化版本

使用4bits的话,需要安装这个量化包

pip install bitsandbytes==0.41.0
pip install transformers==4.30.0

4、启动前修改模型路径

vim OpenAI_api.py
在这里插入图片描述

5、启动api服务

如果需要启动cli_demo.pyweb_demo.py同样要修改模型路径

nohup python OpenAI_api.py >api.out 2>&1 &
  • 启动成功前可以直接启动查看日志并排查错误
    python OpenAI_api.py

  • 启动成功日志:在这里插入图片描述

  • api请求示例

POST http://127.0.0.1:8000/v1/chat/completions

{"model": "Baichuan2-Turbo","messages": [{"role": "user","content": "xxx"}],"temperature": 0.3,"stream": false
}
  • 返回示例:
{"choices": [{"finish_reason": "stop","index": 0,"message": {"content": "xx","role": "assistant"}}],"model": "../Baichuan2-7B-Chat-4bits","object": "chat.completion","usage": {"completion_tokens": 34,"prompt_tokens": 216,"total_tokens": 250}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/534897.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GEE:将数据设置为任何人可读

一些 Google Earth Engine(GEE) 平台的初学者在分享代码的时候,往往不会对代码中的数据设置成任何人可读。这会导致别人打开代码的时候无法正常运行代码,也就无法帮助你修改和调试代码。针对这个问题,本文记录了对 Assets 和 Imports 中的数据…

企业网站为什么要用OV级别的SSL证书?

部署OV SSL证书的网站,可在SSL证书详情中查看网站所属企业名称,可以让用户有效区分出钓鱼网站,鉴别网站的真实身份。企业网站为啥要选OV(组织验证)SSL证书呢?主要有这么几个原因: 1.安全等级更高…

Redis底层数据结构之ZSet

文章目录 1. ZSet2. Skiplist(重点) 1. ZSet Zset在redis6和redis 7的实现是不同的,redis 6的实现采用的是ziplistskiplist,redis 7中采用的是listpackskiplist redis 6 我们看看相关配置: 当我们有序集合中包含的元…

YOLOv9如何训练自己的数据集(NEU-DET为案列)

💡💡💡本文内容:教会你用自己数据集训练YOLOv9模型 YOLOv9魔术师专栏 ☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️ ☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️☁️ 包含注意力机制魔…

Python爬虫入门

什么是爬虫 爬虫就是程序,一个能获取互联网上的资源(文字、图片、音视频)数据的程序。 不用爬⾍, 打开浏览器, 输⼊百度的⽹址,就能在浏览器上看到百度的内容了。那换成爬⾍呢? 道理是⼀样的。只不过,是⽤…

break和continue区别及使用

break和continue是跳转控制语句,本篇文章将详细说明这两个的概念及作用。 1、continue 这张图是2024年3月的日期图,列出了每日和每周。 假设上面是上班工作日期,一个月有三十天,但是每周只有七天。简单思考一下,每周的…

微信小程序开发:上传网络图片到阿里云oss

上文遇到的问题,用户上传的人像图片在经过人像增强后返回的结果需要再次上传到阿里云的oss。 因为是需要下下载,再上传,这个域名我们没有在MP后台配置download域名,所以报错了: 但是MP后台只能配置https的域名&#xf…

微短剧成也“短平快”,败也“短平快”?

微短剧赛道开始上演“热辣滚烫”。 春节期间,《我在八零年代当后妈》以小博大,短剧拍摄仅耗时10天,后期投入8万元,便和《裴总每天都想父凭子贵》一起,拿下过亿的充值收入。 爆火的剧集、惊人的收入,引来大…

应用开发技术巩固指南

前言 起初毕业前夕,个人已经开始自学Android开发,由于没有指导,所以起步很难,写的代码也规范,逻辑不清,技术止步于皮毛,很多东西都不理解。 后来步入工作,逐渐熟悉了这个方向&…

矩阵乘积知识

参考:矩阵点乘【矩阵点乘计算公式】_万动力 矩阵乘 矩阵相乘最重要的方法是一般矩阵乘积。它只有在第一个矩阵的列数(column)和第二个矩阵的行数(row)相同时才有意义 [1] 。 哈达码积 别名:矩阵点乘&…

【C语言】字符串函数下

👑个人主页:啊Q闻 🎇收录专栏:《C语言》 🎉道阻且长,行则将至 前言 这篇博客是字符串函数下篇,主要是关于长度受限制的字符串函数(strncpy,strncat,strncmp)的使用…