大模型的两个重要能力（IF + FC）

news/2024/12/30 23:40:34/文章来源:https://www.cnblogs.com/lightsong/p/18405571

MiniCPM

https://github.com/OpenBMB/MiniCPM

面壁智能推出的大模型，在如下方面支持能出众。

推理长文本 RAG 都是常见的能力。

其中指令遵从(IF=instruction follow) 和工具调用(FC = function call)，威力强大，可以用作很多语音控制场景。

MiniCPM 3.0

MiniCPM 3.0 是一个 4B 参数量的语言模型，相比 MiniCPM1.0/2.0，功能更加全面，综合能力大幅提升，多数评测集上的效果比肩甚至超越众多 7B-9B 模型。

支持工具调用🛠️（Function Calling）和代码解释器💻（Code Interpreter）：Berkeley Function Calling Leaderboard (BFCL) 上取得 9B 规模以下 SOTA，超越 GLM-4-9B-Chat、Qwen2-7B-Instruct。

超强的推理能力🧮：数学能力方面，MathBench 上的效果超越 GPT-3.5-Turbo 以及多个 7B-9B 模型。在非常具有挑战性的 LiveCodeBench 上，效果超越 Llama3.1-8B-Instruct。

出色的中英文指令遵循能力🤖：英文指令遵循 IFEval、中文指令遵循 FollowBench-zh 效果超越 GLM-4-9B-Chat、Qwen2-7B-Instruct。

长文本能力：原生支持 32k 上下文长度，32k 长度内大海捞针全绿。提出 LLM x MapReduce ，理论可处理的上下文长度达到 +∞。

RAG能力：我们发布了 MiniCPM RAG 套件。基于 MiniCPM 系列模型的 MiniCPM-Embedding、MiniCPM-Reranker 在中文、中英跨语言检索测试中取得 SOTA 表现；针对 RAG 场景的 MiniCPM3-RAG-LoRA 在开放域问答等多项任务上超越 Llama3-8B、Baichuan2-13B 等模型。

应用场景

智能家居中的语音控制，不是简单的指令控制，而可以感知用户对话的情绪，做出正确的选择，并下调用相应工作做指令下发。

穿戴场景，如下智能眼镜

对于用户指令做分发决策的大模型，其必然依赖此两种功能 IF + FC

https://zhuanlan.zhihu.com/p/695515605

古鉴认为在语音层面上，大模型整体反馈速度技能指令小于500毫秒，大模型层面小于2秒，这样用户才会觉得这个反馈是足够快的，而且它的反馈足够及时，才能够为用户提供户外运动、文化旅行、日程管理及实时翻译等多种多模态AI服务。古鉴还透露道，李未可科技的WAKE-AI就是以此为优化方向，并即将推出搭载WAKE-AI的终端新品。

第一，我们使用定向优化的分发大模型，帮助快速地分发用户的指令，比如我要听歌，我要跟语音助手聊一聊。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/794724.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

【工具推荐】todesk最新版设备代码、连接密码读取工具，附下载链接

工具介绍： todesk最新版读取设备代码、连接密码工具下载链接: 链接: https://pan.quark.cn/s/237b57f42911使用说明工具使用效果如图看着就真的看着，不学就真的5

代码整洁之道--读书笔记(6)

代码整洁之道简介：本书是编程大师“Bob 大叔”40余年编程生涯的心得体会的总结，讲解要成为真正专业的程序员需要具备什么样的态度，需要遵循什么样的原则，需要采取什么样的行动。作者以自己以及身边的同事走过的弯路、犯过的错误为例，意在为后来者引路，助其职业生涯迈上更…

东方符斗祭，一款类三国杀游戏

介绍题外话不客气的说，当初三国杀的模仿者有一大堆，光是我买过的实体卡就有两种，一个叫做杜甫很忙，另一个是校园题材的，有一张锦囊是爸是x刚，效果记不太清了，估计是无懈可击。东方符斗祭官网 https://www.thbattle.net/github 这个地址其实没什么意义，因为使用了闭源插…

2024-9-9

file类简单学习

微信支付开发避坑指南

1 微信支付的坑 1.1 不能用前端传递过来的金额订单的商品金额要从数据库获取，前端只传商品 id。 1.2 交易类型trade type字段不要传错 v2版API，不同交易类型，要调用的支付方式也不同。 1.3 二次签名下单时，在拿到预支付交易会话标识时，要进行二次签名操作。二次签名后的…

[MySQL]一次死锁排查

字节面试题在可重复隔离级别下，这种情况会发生什么？答案：死锁下面我们用一个具体的例子来展示：首先我们有一张这样的表下面我们来执行一些语句，可以看到结果输出了，检测到发生了死锁 Deadlock found when trying to get lock; try restarting transaction下面具体分析…

微信小程序开发系列6----页面配置--WXML模板快捷传参

源码获取方式（免费）：（1）登录-注册：http://resources.kittytiger.cn/（2）签到获取积分（3）搜索：4-wxmltemplate-WXML模板快捷传参

微信小程序开发系列5----页面配置--WXML列表渲染-wxkey详解

下图本来选中Switch1 更新后选中的是Switch5了使用下图红色部分就能解决，id是data里定义的换name也可以，红色部分不能写item.Id 注：不给wx:key会给一个警告，给了性能会更高源码获取方式（免费）：（1）登录-注册：http://resources.kittytiger.cn/（2）签到获取积分（3）搜…

学习日历-2024/9/9

今天数据结构和马原第一次上课,感觉老师都还不错,作为学委,我也主动找老师加了联系方式今天Java开学考试,14分,还行,在运行中报了一下错,我感觉是我输入的问题, Java关于List的一些知识和数据结构的知识 List List集合特有方法List集合的遍历方式数据结构栈数据进入栈模型的…

一文梳理RAG（检索增强生成）的现状与挑战

一 RAG简介大模型相较于过去的语言模型具备更加强大的能力，但在实际应用中，例如在准确性、知识更新速度和答案透明度方面，仍存在不少问题，比如典型的幻觉现象。因此，检索增强生成 (Retrieval-Augmented Generation, RAG) 被当作于大模型应用开发的一种新范式。RAG是指在利…

我的博客搬家啦！！！

大家好！感谢大家一直以来的支持和关注！经过深思熟虑，我决定将我的博客迁移至博客园的新账号。未来，我将在这个新的平台上持续分享技术文章、项目经验以及个人见解，而原有的博客将不再更新。为什么选择搬家？随着时间的推移，我发现自己对内容创作有了新的想法和方向，而…

Codeforces Round 942 (Div. 1) VP 记录

Codeforces Round 942 (Div. 1) VP 记录我没实力打 Div1 /kk 事实上我唯一 rated 的那场 Div1 切三题是不是运气好啊 /kk /kk A 考虑 \(k = 0\) 的时候怎么做。设最小值为 \(x\)，答案显然是 \(\sum [a_i = x \vee a_i = x + 1] a_i\)。都与最小值相关了，都最小值最大了，直…

大模型的两个重要能力 （IF + FC）

MiniCPM

MiniCPM 3.0

应用场景

相关文章

大模型的两个重要能力（IF + FC）