大模型实践笔记(1)——GLM-6B实践

目录

在Ubuntu上的配置Git Large File Storage

安装Git LFS:

设置Git LFS:

使用Git LFS:

安装GLM-6B 

环境依赖

 ChatGLM2-6B介绍

配置GLM

下载代码

 构建环境

安装依赖 

本地部署 

网页UI 


很多模型在hugging face上面,我们一般采用远程的文件指针形式

在Ubuntu上的配置Git Large File Storage

  1. 安装Git LFS

    • 在大多数Linux发行版上,您可以使用包管理器来安装Git LFS。例如,在基于Debian的系统上(如Ubuntu),您可以使用以下命令:
      sudo apt-get update sudo apt-get install git-lfs
    • 对于其他操作系统或者如果您希望使用不同的安装方法,可以访问Git LFS的官方网站获取更详细的安装指南:Git LFS 官方网站。
  2. 设置Git LFS

    • 安装完成后,您需要设置Git LFS。在您的仓库目录中运行以下命令来初始化Git LFS:
      git lfs install
    • 这个命令会设置必要的Git钩子(hooks),以便Git LFS可以管理大文件。
  3. 使用Git LFS

    • 您可以开始使用Git LFS来追踪大文件了。例如,如果您想追踪所有的 .bin 文件,您可以使用以下命令:
      git lfs track "*.bin"
    • 然后,您可以像平常一样使用 git addgit commit 命令提交您的更改。
    • 当您克隆一个使用Git LFS的仓库时,您可能需要使用 git lfs pull 命令来拉取存储在LFS中的大文件。

安装GLM-6B 

在主要评估LLM模型中文能力的 C-Eval 榜单中,截至6月25日 ChatGLM2 模型以 71.1 的分数位居 Rank 0 ,ChatGLM2-6B 模型以 51.7 的分数位居 Rank 6,是榜单上排名最高的开源模型。

环境依赖

  • CUDA 11.7

  • Python 3.10

  • pytorch 1.13.1+cu117

 ChatGLM2-6B介绍

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B 引入了如下新特性:

  • 更强大的性能:基于 ChatGLM 初代模型的开发经验,我们全面升级了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 使用了 GLM 的混合目标函数,经过了 1.4T 中英标识符的预训练与人类偏好对齐训练,评测结果显示,相比于初代模型,ChatGLM2-6B 在 MMLU(+23%)、CEval(+33%)、GSM8K(+571%) 、BBH(+60%)等数据集上的性能取得了大幅度的提升,在同尺寸开源模型中具有较强的竞争力。

  • 更长的上下文:基于 FlashAttention 技术,我们将基座模型的上下文长度(Context Length)由 ChatGLM-6B 的 2K 扩展到了 32K,并在对话阶段使用 8K 的上下文长度训练,允许更多轮次的对话。但当前版本的 ChatGLM2-6B 对单轮超长文档的理解能力有限,我们会在后续迭代升级中着重进行优化。

  • 更高效的推理:基于 Multi-Query Attention 技术,ChatGLM2-6B 有更高效的推理速度和更低的显存占用:在官方的模型实现下,推理速度相比初代提升了 42%,INT4 量化下,6G 显存支持的对话长度由 1K 提升到了 8K。

  • 更开放的协议:ChatGLM2-6B 权重对学术研究完全开放,在获得官方的书面许可后,亦允许商业使用。如果您发现我们的开源模型对您的业务有用,我们欢迎您对下一代模型 ChatGLM3 研发的捐赠。

配置GLM

下载代码

 $ git clone https://github.com/THUDM/ChatGLM2-6B

 构建环境

$ conda create -n GLM python=3.10       # 创建新环境
$ conda activate GLM                    # 激活环境

安装依赖 

 $ cd ChatGLM2-6B$ pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

本地部署 

$ git lfs install
$ git clone https://huggingface.co/THUDM/chatglm2-6b

模型的实现仍然处在变动中。如果希望固定使用的模型实现以保证兼容性,可以在 from_pretrained 的调用中增加 revision="v1.0" 参数。v1.0 是当前最新的版本号,完整的版本列表参见 Change Log。

Cli测试

修改cli_demo.py

$ python cli_demo.py

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/449320.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

线性代数:线性方程组

目录 一、线性方程组概念 二、消元法求线性方程组 三、系数阵的秩与线性方程组的解 无解 唯一解 无数解 相关定理 一、线性方程组概念 二、消元法求线性方程组 三、系数阵的秩与线性方程组的解 无解 唯一解 无数解 相关定理

【笔记】React Native实战练习(仿网易云游戏网页移动端)

/** * 如果系统看一遍RN相关官方文档,可能很快就忘记了。一味看文档也很枯燥无味, * 于是大概看了关键文档后,想着直接开发一个Demo出来,边学边写,对往后工作 * 开发衔接上能够更顺。这期间肯定会遇到各种各样的问题&a…

STM32F407移植OpenHarmony笔记8

继上一篇笔记,成功开启了littlefs文件系统,能读写FLASH上的文件了。 今天继续研究网络功能,让控制台的ping命令能工作。 轻量级系统使用的是liteos_m内核lwip协议栈实现网络功能,需要进行配置开启lwip支持。 lwip的移植分为两部分…

计算机图形学 实验

题目要求 1.1 实验一:图元的生成:直线、圆椭区域填充 你需要完成基本的图元生成算法,包括直线和椭圆。 在区域填充中,要求你对一个封闭图形进行填充。你需要绘制一个封 闭图形(例如多边形),并选…

HTTP和HTTPS区别!

http 是我们几乎天天都要打交道的东西,相关知识点有点多,所以也有不少面试必问的点,这里做了一些整理,帮且大家树立完整的 http 知识体系,对面试官说 so easy HTTP 的特点和缺点 特点:无连接、无状态、灵…

网络时间协议NTP工作模式

单播服务器/客户端模式 单播服务器/客户端模式运行在同步子网中层数较高层上。这种模式下,需要预先知道服务器的IP地址。 客户端:运行在客户端模式的主机(简称客户端)定期向服务器端发送报文,报文中的Mode字段设置为3(客户端模式)。当客户端接收到应答报文时,客户端会…

MATLAB拟合正态分布(附完整代码和数据)

使用MATLAB拟合正态分布的主要步骤是: 输入样本数据 使用变量x保存样本数据,例如: x [1.2, 3.4, 2.1, 0.5, 4.3]; 调用正态分布的最大似然估计函数 使用normfit函数来完成正态分布的参数的最大似然估计: [mu_hat,sigma_hat] normfit(x); normfit函数会返回正态分布位置…

查看自己电脑是arm还是x64(x86)

linux 参考: https://liuweiqing.blog.csdn.net/article/details/131783851 uname -a如果输出是 x86_64,那么你的系统是 64 位的 x86 架构(通常我们称之为 x64)。如果输出是 armv7l 或者以 arm 开头的其他值,那么你的…

FS【2】:CAT-Net

文章目录 前言AbstractIntroductionMethodsProblem DefinitionNetwork OverviewMask Incorporated Feature ExtractionCross Masked Attention TransformerSelf-Attention ModuleCross Masked Attention ModulePrototypical Segmentation Module Iterative Refinement Framewor…

使用 IDEA 开发一个简单易用的 SDK

目录 一、什么是 SDK 二、为什么要开发 SDK 三、开发 SDK 的详细步骤 四、导入 SDK 进行测试 附:ConfigurationProperties 注解的介绍及使用 一、什么是 SDK 1. 定义:软件开发工具包 Software Development Kit 2. 用于开发特定软件或应用程序的工…

【2024年美国大学生数学建模竞赛】F题完整解析(问题分析、数学模型、实现代码、参考论文)

减少非法野生动物贸易的综合数据驱动项目 写在前面摘要1、问题重述1.1、问题背景:1.2、问题描述: 1.3子问题详述:1. 客户选择:2. 项目适应性和支持:3. 客户资源和权力需求:4. 项目影响分析:5. 成…

爬虫(二)使用urllib爬取百度贴吧的数据

下一期我就不用urllib来抓取数据了,因为urllib现在已经很少人用,大部分人用得是requests,requests也是基于底层urllib的一个模块。 首先我先来讲一下关于如何使用动态的UA! 动态UA就是指在自己创建的一个列表里随机选择一个UA当做…