小模型(SLM)的效率、性能和潜力

news/2024/9/28 22:50:31/文章来源:https://www.cnblogs.com/little-horse/p/18438563

关于小语言模型

小语言模型(slm)是为在桌面、智能手机和可穿戴设备上进行资源高效部署而设计的。

其目标是使先进的机器智能能够为每个人所使用和负担得起,就像人类认知的普遍性一样。

小语言模型(slm)已经广泛集成到商业设备中。例如,最新的谷歌和三星智能手机内置了大型语言模型(LLM)服务,如 Gemini Nano,它允许第三方应用程序通过提示和模块化集成来访问 LLM 功能。

同样,iphone 和 ipad 上最新的 iOS 系统包括一个与操作系统紧密集成的设备上基础模型,既增强了性能,又增强了隐私。这种广泛采用显示了 slm 在日常技术中的潜力。

通过在个人设备上启用人工智能功能,slm 旨在使强大技术的使用民主化,使人们能够随时随地使用智能系统,而无需依赖基于云的资源。

slm 的关键见解:

  1.  2022 年 2024 年,slm 在语言任务上表现出了显著的性能提升,超过了 LLaMA-7B 系列,表明了在设备上解决任务的强大潜力。
  2. Phi 系列,特别是 Phi-3-mini 在 2024 年 9 月之前达到了领先的精度,部分原因是数据工程和微调技术
  3. 虽然较大的型号通常表现更好,但像 Qwen2-1.5B 这样的较小型号在特定任务中表现出色。
  4. 在开源数据上训练的 slm 正在改进,但在复杂的推理任务中,特别是涉及逻辑和数学的任务,仍然落后于闭源模型。
  5. 大多数 slm 都具有一定程度的上下文学习,但其有效性因任务而异。虽然几乎所有模型都从任务中的上下文学习中受益匪浅。
  6. 模型架构会显著影响延迟和模型大小。
  7. 模型的架构,包括层和词汇量大小等因素,会影响其速度和内存使用。例如,Qwen1.5-0.5B 比 Qwen2-0.5B 有更多的参数,但在某些硬件上运行得更快,这表明性能取决于设备。
  8. 语言模型对“小”的定义是主观的,随着设备内存的增加,可能会随着时间的推移而改变,这使得将来更大的模型被认为是“小”的。
  9. 目前,小型语言模型的参数限制为 50 亿,因为到 2024 年 9 月,70
    亿个参数模型仍主要部署在云中。
  10. 这种区别反映了硬件不断发展的能力和当时的实际部署限制。
  11. 数据质量对小语言模型(Small Language Models, slm)的性能至关重要,

在最近的研究中得到了越来越多的关注。

一般来说,数据的质量比数据的数量或特定的模型架构更重要。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/805431.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PbootCMS上传的缩略图为什么变模糊尺寸还变小了了?

如果你在使用PbootCMS后台发布内容时,发现上传的缩略图在上传成功后变得模糊且尺寸变小,这通常是由于PbootCMS默认的图片尺寸限制导致的。以下是如何解决这个问题的具体步骤: 解决方案打开配置文件打开config目录下的config.php文件。修改缩略图配置在config.php文件中找到缩…

2024.9.23 cj 训练总结

T1这道题目仔细观察就会发现:异或 k=1这就很好办,考虑 k=1 怎么解 3 1 2 4 5 6 7.......... 即可。 异或,找规律发现有很多数字的异或值为0的。最后的答案是有规律的。 不知道什么问题,场上就70分。 T2这道题目基本上没啥思路,就是弄了个桶10分。 正解: 由于这个题目的字…

2024.9.23 - 2024.9.28 cj 训练总结

T1这道题目仔细观察就会发现:异或 k=1这就很好办,考虑 k=1 怎么解 3 1 2 4 5 6 7.......... 即可。 异或,找规律发现有很多数字的异或值为0的。最后的答案是有规律的。 不知道什么问题,场上就70分。 T2这道题目基本上没啥思路,就是弄了个桶10分。 正解: 由于这个题目的字…

结对项目:自动生成小学四则运算题目的命令行程序

这个作业属于哪个课程 计科22级12班这个作业要求在哪里 https://edu.cnblogs.com/campus/gdgy/CSGrade22-12/homework/13221姓名 学号曾繁曦 3122004841吴健民 3122004667PSP表格一、流程图二、模块设计 1.模块划分Main模块(Main.java) 功能描述:程序的入口点,负责接收命令…

作业三:结对项目

结对项目 一、作业介绍这个作业属于哪个课程 班级的链接这个作业要求在哪里 作业要求的链接这个作业的目标 完成小学四则运算题目的命令行程序,熟悉项目开发流程,提高团队合作能力二、成员信息代码仓库 GitHub成员1 杨智雄-3122004409成员2 陈愉锋-3122004387三、效能分析 各…

题解 ABC373G【No Cross Matching】/ POJ3565【Ants】

题目描述 年轻的自然主义者比尔在学校里研究蚂蚁。他的蚂蚁以生活在苹果树上的蚜虫为食。每个蚂蚁群需要自己的苹果树来养活自己。比尔有一张地图,上面标有 \(n\) 个蚂蚁群和 \(n\) 棵苹果树的坐标。他知道蚂蚁从它们的蚂蚁群到它们的取食地点,然后返回蚂蚁群,都是使用化学标…

代码随想录算法训练营第三天|203.移除链表元素,707.设计链表,206.反转链表

203.移除链表元素文章链接:https://programmercarl.com/0203.移除链表元素.html#算法公开课 视频讲解:https://www.bilibili.com/video/BV18B4y1s7R9 题目出处:https://leetcode.cn/problems/remove-linked-list-elements/卡哥在这里讲解了为什么要使用虚拟头节点,以及使用…

Android页面跳转与返回机制详解

在Android开发中,页面跳转是实现应用功能交互的重要手段之一。本文将从Activity之间的跳转、Activity与Fragment之间的跳转、Fragment之间的跳转以及页面返回的问题四个方面进行详细解析。 一、Activity之间的跳转 Activity是Android应用的基本构建块,代表了一个用户界面的单…

04-Consul服务注册与发现

1.为什么要引入服务注册中心 1.1 原因 public static final String PAYMENT_SRV_URL = "http://localhost:8001";//硬编码微服务所在的IP地址和端口号硬编码到订单微服务中,会存在非常多的问题 (1)如果订单微服务和支付微服务的IP地址或者端口号发生了变化,则支付…

SMOI-R1 赛后若干个月的总结

关于我只差一个许多人 AC 的题目就能与另一个人瓜分 $20$ 块钱这件事。打得非常好的一场比赛,所以才来写总结。 T1 「SMOI-R1」Queue 打表找规律题,太签到了,不讲。 T2 「SMOI-R1」Company 首先,如果要使得 \(x,y\) 的距离最后是尽可能远的,我们就要考虑一些满足最优解的性…

星际战甲:战甲配卡

题记部分 一、永恒烈焰(火鸡)进图开2,随后4技能升温、3技能降温,钢铁地图炮 二、标题三、标题— 业精于勤荒于嬉,行成于思毁于随 —