LLM Note 1

文章目录

  • Speculative decoding(sampling)
  • 重复
    • Beam search
    • Contrastive search
  • Hallucination
  • Embbeding overlappep
    • 简单例子
    • vector space overlapped
  • Top K, Top P, Temperature
  • MOE

Speculative decoding(sampling)

(感谢 Efficient NLP)
以下的内容,主要帮助decoding高质量内容,特别是速度上有了提升,并且是,这种一大一小两个模型一起跑的方式比一个大模型单跑要快~
Draft model (P): 一般指比较小的模型。 Target model (Q):一般指正式的大模型
算法:
1:先在小模型(Draft model)上将N个tokens 得到,多少个token就跑多少次
2:然后在大模型(Target model)上一次性得到小模型分次跑的所有tokens,一次性得到N个tokens,并且还可以得到第N+1次的token

3: 图中目前获得了从两种模型得到的token 对应的probabilities。这时,需要确定哪些token是有效的要保留的,判断条件如下:

- 1: q(x) >= p(x), 保留
- 2:如果q(x) < p(x), 先得到:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/479372.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软件安装遇到bug、报错不知道怎么解决?赶紧收藏起来!

前言 本文举例了几个常见的软件工具使用问题&#xff0c;文末会提供一些我自己整理和使用的工具资料 。 "在追逐零 Bug 的路上&#xff0c;我们不断学习、改进&#xff0c;更加坚定自己的技术信念。让我们相信&#xff0c;每一个 Bug 都是我们成长的机会。" 一、VM…

C++之C++输入输出流

目录 1、输入输出的含义 2、C输入输出机制 2.1、"流"的概念 2.2、C常用流类型 2.3、流类型之间的关系 2.4、流的状态 2.5、管理流的状态 2.6、流的通用操作 2.7、缓冲区 2.7.1、为什么要引入缓冲区呢&#xff1f; 2.7.2、缓冲区要做哪些工作&#xff1f; …

[计算机网络]---UDP协议

前言 作者&#xff1a;小蜗牛向前冲 名言&#xff1a;我可以接受失败&#xff0c;但我不能接受放弃 如果觉的博主的文章还不错的话&#xff0c;还请点赞&#xff0c;收藏&#xff0c;关注&#x1f440;支持博主。如果发现有问题的地方欢迎❀大家在评论区指正 目录 一、端口号…

【小呆的力学笔记】弹塑性力学的初步认知五:初始屈服条件(1)

文章目录 3. 初始屈服条件3.1 两个假设以及屈服条件基本形式3.2 π \pi π平面、Lode参数3.3 屈服曲线的一般特征 3. 初始屈服条件 3.1 两个假设以及屈服条件基本形式 在简单拉伸时&#xff0c;材料的屈服很明确&#xff0c;即 σ > σ s (1) \sigma\gt\sigma_s\tag{1} …

人工智能|机器学习——基于机器学习的舌苔检测

代码下载&#xff1a; 基于深度学习的舌苔检测毕设留档.zip资源-CSDN文库 1 研究背景 1.1.研究背景与意义 目前随着人们生活水平的不断提高&#xff0c;对于中医主张的理念越来越认可&#xff0c;对中医的需求也越来越多。在诊断中&#xff0c;中医通过观察人的舌头的舌质、苔…

VSCode-下载安装-远程连接linux(方便容器编排格式学习)

VSCode下载安装 下载安装请参考 VSCode下载教程https://blog.csdn.net/weixin_43121885/article/details/131779104?ops_request_misc%257B%2522request%255Fid%2522%253A%2522170812811316800211530507%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&am…

欢迎来到IT时代----盘点曾经爆火全网的计算机电影

计算机专业必看的几部电影 计算机专业必看的几部电影&#xff0c;就像一场精彩的编程盛宴&#xff01;《黑客帝国》让你穿越虚拟世界&#xff0c;感受高科技的魅力&#xff1b;《社交网络》揭示了互联网巨头的创业之路&#xff0c;《源代码》带你穿越时间解救世界&#xff0c;这…

校园跑腿小程序源码系统 带完整的搭建教程

近年来&#xff0c;随着高校规模的不断扩大&#xff0c;学生对校园生活服务的需求日益增长。传统的校园服务模式已经无法满足现代大学生的便捷化、个性化需求。因此&#xff0c;开发一款能够整合校园资源、提供便捷服务的跑腿小程序显得尤为重要。这款源码系统的出现&#xff0…

CSS position属性sticky

在开发时&#xff0c;经常会碰到需要这样一种情况 —— 网站滚动到一定高度的时候&#xff0c;让一部分内容作为navbar&#xff0c;也就是置顶显示&#xff0c;我们一般会使用js监听scroll事件来实现&#xff0c;但是新增的css3属性position:sticky可以简单实现&#xff0c;省去…

MongoDB文档插入

文章目录 MongoDB文档插入对比增删改查文档插入 MongoDB写安全机制非确认式写入 MongoDB文档查询参数说明查询操作符比较查询操作符逻辑查询操作符元素查询操作符数组查询操作符 模糊查询区别:$regex操作符中的option选项 MongoDB游标介绍游标函数手动迭代游标示例游标介绍 Mon…

家政服务小程序开发:家政数字化发展

近几年&#xff0c;随着人们生活水平的提高&#xff0c;对生活品质的追求也不断提高&#xff0c;家政服务市场迎来了爆发期&#xff01;家政服务也逐渐发展完善&#xff0c;由传统的保洁、月嫂&#xff0c;到现在的上门维修、美发、美容等&#xff0c;家政服务与人们的生活日益…

Camunda和SpringBoot的兼容版本

官网 https://docs.camunda.org/manual/7.15/user-guide/spring-boot-integration/version-compatibility/ Camunda和SpringBoot的兼容版本