利用GPT开发应用003:GPT分词和预测

文章目录

  • 一、概率问题
  • 二、令牌(分词)
  • 三、预测

一、概率问题

  像 GPT 这样的大型语言模型接收一个提示,并返回通常在上下文中有意义的输出。例如,提示可以是“今天天气很好,所以我决定”(“The weather is nice today,so I decided to”),而模型输出可能是“去散步”。你可能想知道 LLM 模型是如何从输入提示构建这个输出文本的。正如你将看到的,这主要只是一个概率问题


二、令牌(分词)

  当将提示发送给一个LLM时,它首先将输入分解成称为令牌的较小部分。这些令牌代表单个单词或单词的一部分。例如,前面的提示可以分解如下:[“The”, “wea”, “ther”, “is”, “nice”, “today”, “,”, “so”, “I”, “de”, “ci”, “ded”, “to”]。每个语言模型都有自己的分词器。截至撰写本文时,尚无GPT-4的分词器可用,但您可以测试GPT-3的分词器。

  提示:在估计单词长度方面理解令牌的一个经验法则是,对于英文文本,100个令牌大约相当于75个单词。

  由于注意力机制和之前介绍的变换器架构,LLM可以处理这些令牌并解释它们之间的关系以及提示的整体含义。这种变换器架构使得模型能够高效地识别文本中的关键信息和上下文。


三、预测

  为了创建一个新的句子,LLM根据提示的上下文预测最有可能的下一个令牌。OpenAI发布了两个版本的GPT-4,分别具有8,192个令牌32,768个令牌的上下文窗口。与以前的循环模型不同,它们难以处理长输入序列,具有注意力机制的变换器架构使得现代LLM能够将整个上下文作为一个整体考虑。基于这个上下文,模型为每个可能的下一个令牌分配一个概率分数,并根据这个分数选择其中一个作为下一个令牌。在我们的例子中,在“今天天气很好,所以我决定”之后,下一个最佳令牌可能是“出去”。

  然后这个过程会重复进行,但现在上下文变为“今天天气很好,所以我决定出去”,之前预测的令牌“出去”被添加到原始提示中。模型可能预测的第二个令牌可能是“散步”。这个过程会一直重复,直到形成完整的句子:“出去散步”。这个过程依赖于LLM从大量文本数据中学习下一个最可能的单词的能力。下图说明了这个过程。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/520295.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

检测螺栓扭矩的方法有哪些——SunTorque智能扭矩系统

螺栓扭矩的检测是确保螺栓连接紧固程度和安全性的重要环节。正确的扭矩检测能够预防螺栓松动、断裂等潜在风险,从而保障设备和结构的稳定运行。SunTorque智能扭矩系统接下来将详细介绍螺栓扭矩的检测方法。 螺栓扭矩的检测是确保螺栓连接紧固程度和安全性的重要环节…

什么是VR全息投影技术|元宇宙文旅|VR设备购买

VR全息投影技术是一种结合了虚拟现实(VR)和全息投影技术的创新技术,旨在创造出更加沉浸式和真实感的体验。 在这种技术中,用户可以通过戴上特殊的头戴式显示器(如VR头显)进入虚拟现实世界,同时通…

Spark Core

Spark Core 一、Spark RDD RDD概述 1.RDD基础 2.RDD源代码描述 3.RDD特性 4.Spark宽窄依赖 RDD创建 在驱动器中创建RDD 1.parallelize 读取外部数据集创建RDD 2.textFile RDD操作 缓存rdd到内存 1.RDD转化操作 2.常见的转化操作 3.RDD行动操作 4.常见的行动操作 Spark…

HTTP协议(请求方式,响应方式,请求行、头、体,状态码)是热点面试题【详解】

目录 1. HTTP简介 1.介绍 2.浏览器抓包 3.特点 2. HTTP请求 1.HTTP请求的格式 2.HTTP请求方式 3.GET方式的请求示例 请求行 请求头 请求体 4.POST方式的请求示例 请求行 请求头 请求体 GET和POST的区别 5.HTTP响应 1.HTTP响应的格式 2 常见响应头 3 响应…

企业财务分析该怎么做?重点分析哪些财务指标?

在企业经营管理的过程中,财务分析是评估当前企业或特定部门财务状况和绩效的过程,这一过程通常涉及对财务报表(如资产负债表、利润表和现金流量表)进行定量和定性的评估,以便为盈利能力、偿债能力、现金流动性和资金稳…

【计算机系统】2.进程管理

【计算机系统】2.进程管理 这个章节十分的重要,作业也要好好做,因为我学的是后端,学计算机进程的处理对于搞并发来说十分有用。 提出问题 6、试从动态性、并发性和独立性上比较进程和程序。19、为什么要在OS中引入线程?A.请用信号量解决以下…

如何搭建财务数据运营体系:基于财务五力模型的分析

在当今复杂多变的商业环境中,财务数据作为企业决策的重要参考依据,其运营体系的搭建显得尤为关键。一个健全、高效的财务数据运营体系不仅能够为企业提供准确的财务数据支持,还能帮助企业在激烈的市场竞争中保持领先地位。基于财务五力模型的分析,我们可以从收益力、安定力…

第三方软件测试报告有效期是多久?专业软件测试报告获取

第三方软件测试报告是在软件开发过程中,由独立的第三方机构对软件进行全面测试和评估后发布的报告。这些第三方机构通常是与软件开发商和用户无关的专业技术机构,具备丰富的测试经验和专业知识。    第三方测试报告具有以下几个好处:   …

c++ 11 新特性 不同数据类型之间转换函数之const_cast

一.不同数据类型之间转换函数const_cast介绍 const_cast是C11中引入的一种类型转换操作符,用于修改类型的const或volatile属性。const_cast的主要用途是移除对象的常量性,它是唯一具有此能力的C风格的转型操作符。在C11中,const_cast可以完成…

YoloV8改进策略:Block改进|自研Block,涨点超猛|代码详解|附结构图

涨点效果 涨点效果:在我自己的数据集上,mAP50 由0.986涨到了0.993,mAP50-95由0.737涨到0.757,涨点明显! 参考模型 参考的Block,如下图: 我对Block做了修改,修改后的结构图如下: 代码详解 from timm.models.layers import DropPathfrom torch import Tensor def …

黑马java-JavaWeb-MySQL基本操作

1.JavaWeb: 用java技术来解决相关web互联网领域的技术栈 2.数据库: 存储数据的仓库,数据是有组织的进行存储 英文:DataBase,简称DB 3.数据库管理系统: 管理数据库的大型软件 英文:DataBase Mana…

链表|707.设计链表

力扣题目链接 typedef struct MyLinkedList {int val;struct MyLinkedList* next; }MyLinkedList;/** Initialize your data structure here. */MyLinkedList* myLinkedListCreate() {//这个题必须用虚拟头指针,参数都是一级指针,头节点确定后没法改指向了!!!MyLinkedList* he…