【书生·浦语大模型实战营】第5节 课后作业

LMDeploy 的量化和部署

  • 0. 课程链接
  • 1. 课后作业
    • 1.1 基础作业
    • 1.2 进阶作业(可选做)

0. 课程链接

课程logo
链接:https://github.com/InternLM/tutorial/blob/main/lmdeploy/lmdeploy.md

1. 课后作业

1.1 基础作业

使用 LMDeploy 以本地对话、网页Gradio、API服务中的一种方式部署 InternLM-Chat-7B 模型,生成 300 字的小故事(需截图)
作业截图
提示词:一个程序员在办公室加班,晚上11点,咖啡杯不小心打翻 到电脑上,程序员触电穿越到大明,拯救即将灭亡的大明朝的故事,生成300字
书生:

在一个深夜,程序员小明正坐在电脑前努力地工作着。突然,他感到一阵刺痛,随后便失去了知觉。当他再次醒来时,发现自己已经穿越到了明朝时期。

小明惊讶地发现自己身处在一个荒凉的村庄里,周围都是陌生的景象和声音。他开始四处寻找出路,希望能够回到现代。然而,他很快就发现,自己已经成为了这个村庄里的一名普通村民。

小明很快发现,他所处的明朝正面临着一场巨大的危机。皇帝被奸臣所害,国家陷入了混乱和动荡之中。小明决定挺身而出,用自己的技术知识和智慧来拯救这个即将灭亡的大明。

小明开始学习明朝的历史和文化,并且利用自己的编程技能,开发出了一系列能够帮助明朝抵御外敌的武器和工具。他还利用自己的网络知识,建立了一个庞大的情报网络,收集到了许多有用的信息。

最终,小明成功地帮助明朝度过了危机,并且成为了明朝的一位英雄。他用自己的行动证明了技术不仅能够改变世界,还能够拯救文明。

小明回到了现代,但是他并没有忘记他所做的一切。他决定继续利用自己的技术知识和智慧,为人类社会做出更多的贡献。

这就是小明的故事,一个程序员穿越时空,拯救大明的传奇。

1.2 进阶作业(可选做)

将第四节课训练自我认知小助手模型使用 LMDeploy 量化部署到 OpenXLab 平台。
对internlm-chat-7b模型进行量化,并同时使用KV Cache量化,使用量化后的模型完成API服务的部署,分别对比模型量化前后(将 bs设置为 1 和 max len 设置为512)和 KV Cache 量化前后(将 bs设置为 8 和 max len 设置为2048)的显存大小。
在自己的任务数据集上任取若干条进行Benchmark测试,测试方向包括:
(1)TurboMind推理+Python代码集成
(2)在(1)的基础上采用W4A16量化
(3)在(1)的基础上开启KV Cache量化
(4)在(2)的基础上开启KV Cache量化
(5)使用Huggingface推理
备注:由于进阶作业较难,完成基础作业之后就可以先提交作业了,在后续的大作业项目中使用这些技术将作为重要的加分点!

进阶作业嘛,天寒地冻的必然做不了,待春暖花开时再做!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/512829.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

开展庆2024年“三八”国际妇女节系列纪念活动怎样向媒体投稿?

为了向媒体投稿,庆祝2024年“三八”国际妇女节系列纪念活动,你可以遵循以下步骤: 策划与准备: 确定纪念活动的主题和目标,例如提升女性权益、表彰女性成就、促进性别平等。 策划一系列活动,如研讨会、表彰仪式、展览、讲座等,确保内容丰富多样。 准备相关的背景资料、活动介…

解决物理机装不上VMnet1和VMnet8的虚拟网卡问题

问题描述: 博主在使用虚拟机时,发现物理机的ping命令连接不上虚拟机,导致xshell软件也连接不上,最后发现问题是更改适配器设置中没有虚拟机的网卡(VMnet1和VMnet8): 方法一: 博主搜…

通过Apple Configurator 2导出iOS ipa包

通过Apple Configurator 2导出iOS ipa包 安装Apple Configurator 2 从Mac AppStore安装Apple Configurator 2 下载ipa 准备工作: 1、 电脑已经安装了Apple Configurator 2 2、 手机已经安装了目标软件 3、 Apple 账号已经下载过目标软件 打开后连接设备&#xf…

幻兽帕鲁(1.5.0)可视化管理工具(0.5.7 docker版)安装教程

文章目录 局域网帕鲁服务器部署教程帕鲁服务可视化工具安装配置服务器地址(可跳过)使用工具管理面板 1.5.0服务端RCON错误1.5.0服务端无法启动RCON端口 解决方法第一步:PalWorldSettings.ini配置第二步:修改PalServer.sh配置 局域…

深入理解现代JavaScript:从语言特性到应用实践

💂 个人网站:【 海拥】【神级代码资源网站】【办公神器】🤟 基于Web端打造的:👉轻量化工具创作平台💅 想寻找共同学习交流的小伙伴,请点击【全栈技术交流群】 JavaScript作为一门动态、解释性脚本语言&…

安泰ATA-4051高压功率放大器在仿生水下声接收器设计中的应用

实验名称:ATA-4051功率放大器在仿生水下声接收器设计中的应用 实验目的:通过实验验证仿生水下声接收器的接收灵敏度与接收指向性 实验内容:搭建了水下声学测量系统进行实验,探究仿生水下声接收器的接收增益与接收指向性。 实验设备…

Tonka Finance,BTCFi 浪潮的发动机

在 2023 年年初,Ordinals 技术方案为比特币 Layer1 带来了一种全新的资产发行方式,此后一场以比特币生态为主战场的新一轮资金、注意力价值争夺战打响,并且越来越多的加密原教旨主义者、密码极客们加入这场战争中。我们看到,铭文市…

YOLOv8从入门到入土使用教程!(三)验证模型

⭐⭐⭐瞧一瞧看一看,新鲜的YOLOv9魔改专栏来啦!⭐⭐⭐ YOLOv9有效改进专栏汇总|未来更新卷积、主干、检测头注意力机制、特征融合方式等创新 一、本文介绍 本文将演示如何使用YOLOv8进行训练、预测及验证!模型训练、预测教程参考下文&#xf…

FreeRTOS操作系统学习——FreeRTOS工程创建

FreeROTS工程创建 详细步骤 如无特殊情况,大部人都要配置为外部高速时钟 另外,本实验使用了FreeRTOS,FreeRTOS的时基使用的是Systick,而 STM32CubeMX中默认的HAL库时基也是Systick,为了避免可能的冲突,最…

【Algorithms 4】算法(第4版)学习笔记 15 - 4.1 无向图

文章目录 前言参考目录学习笔记1:图表介绍1.1:定义1.2:常见应用1.3:术语1.4:一些图表处理问题2:图表 API2.1:图的表示2.2:无向图 API2.3:典型图处理代码2.4:图…

web游戏-飞机大战

H5小游戏源码、JS开发网页小游戏开源源码大合集。无需运行环境,解压后浏览器直接打开。有需要的,私信本人,发演示地址,可以后再订阅,发源码,含60+小游戏源码。如五子棋、象棋、植物大战僵尸、开心消消乐、扑鱼达人、飞机大战等等 <!DOCTYPE html> <html lang=&q…

uniapp制作--进步器的选择

介绍&#xff1a; 进步器的选择,一般用于商城购物选择物品数量的场景 注意&#xff1a;该输入框只能输入大于或等于0的整数 效果展示&#xff1a; 代码展示&#xff1a; 以下是一个简单的购物车页面示例&#xff0c;包括选择商品和显示数量的功能&#xff1a; 在这个示例中…