ChatGPT学习第二周

📖 学习目标

  • 自然语言处理(NLP)简介
    • 探索自然语言处理的基本原理,理解其在ChatGPT中的应用。
  • GPT模型概述
    • 了解生成式预训练变换器(GPT)的工作原理。

✍️ 学习活动

学习资料

  • 《走进AI(三) | 解构 NLP》—Process On
  • 《一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)》—微信公众号——AI科技在线
  • 《AI产品经理必修课:NLP技术原理与应用》—人人都是产品经理——Alan
  • 《基于深度学习的人机对话系统原理及应用》—客户世界——宁雪莉
  • 《GPT》—GitHub——Paddlepaddle

学习笔记

自然语言处理(NLP)基础知识
  • NLP的定义
      自然语言处理( Natural Language Processing, NLP)指的是能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言就是大家平时在生活中常用的表达方式,大家平时说的「讲人话」就是这个意思。
    在这里插入图片描述

  • NLP的组成
      NLP 由两个主要的技术领域构成:自然语言理解(NLU)和自然语言生成(NLG)。主要包含的技术领域如下图所示。
    在这里插入图片描述

  • NLP的工作原理
      NLP工作原理分为这几步:首先,我们会对文本进行预处理,这个过程包括清理文本、切分词语、提取词干以及标注词性,以便将原始文本数据转化为更适合模型处理的形式。接着,我们会提取文本的特征,将文本转化为数值形式,使得模型可以处理。然后,我们会基于这些特征训练各种机器学习或深度学习模型。一旦模型训练完成,我们就可以用它对新的数据进行预测,并使用各种评估指标来评估模型的性能。最后,我们将训练好的模型应用于各种NLP任务,如文本分类、情感分析、命名实体识别、关键词提取、机器翻译、语音识别、聊天机器人等。下图是自然语言处理的核心技术和处理流程以及深度学习模型的训练流程。
    NLP处理流程
    在这里插入图片描述

  • NLP在ChatGPT中的应用
      NLP是一系列使计算机能够理解、处理和生成人类语言的技术,而ChatGPT正是这些技术的一个应用实例。ChatGPT是一个聊天机器人,它使用了NLP中的深度学习模型——特别是Transformer模型——来理解和生成文本。这个模型在大量的文本数据上进行训练,学习如何用人类语言进行有效的交流。下图是NLP在ChatGPT对话实例中的作用。
    在这里插入图片描述

GPT模型概述
  • GPT模型的定义
      GPT(Generative Pre-training Transformer)是由OpenAI开发的一个自然语言处理模型。该模型使用了一种称为Transformer的深度学习模型,该模型最初是由Google的研究者在“Attention is All You Need”这篇论文中提出的。 GPT 模型是用一种半监督学习的方法来完成语言理解任务,GPT 的训练过程分为两个阶段:无监督Pre-training 和 有监督Fine-tuning。在Pre-training阶段使用单向 Transformer 学习一个语言模型,对句子进行无监督的 Embedding,在fine-tuning阶段,根据具体任务对 Transformer 的参数进行微调,目的是在于学习一种通用的 Representation 方法,针对不同种类的任务只需略作修改便能适应。
  • Transformer模型与GPT模型之间的关系
      GPT 使用 Transformer 的 Decoder 结构,并对 Transformer Decoder 进行了一些改动,原本的 Decoder 包含了两个 Multi-Head Attention 结构,GPT 只保留了 Mask Multi-Head Attention(即每个子层只有一个 Masked Multi Self-Attention(768 维向量和 12 个 Attention Head)和一个 Feed Forward),如下图所示。
    在这里插入图片描述

  GPT模型仅仅使用了Transformer模型中的解码器部分,原因是语言模型的目标是利用已知的文本(上文)来预测下一个单词。在解码器中使用的是一种名为"Masked Multi Self-Attention"的技术,这种技术会屏蔽输入序列中未来的信息,也就是说在预测一个单词时,模型无法看到它后面的单词,从而模仿了语言模型的行为。然后,因为GPT模型只使用了解码器,没有使用编码器,所以它不需要使用到编码器和解码器之间的注意力机制,这种注意力机制在Transformer模型中是用来帮助解码器理解输入序列的。

  • GPT模型结构图
      下图是GPT模型的结构图。
    GPT模型结构图

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/484373.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Transformer 架构—Encoder-Decoder

文章目录 前言 一、Encoder 家族 1. BERT 2. DistilBERT 3. RoBERTa 4. XML 5. XML-RoBERTa 6. ALBERT 7. ELECTRA 8. DeBERTa 二、Decoder 家族 1. GPT 2. GPT-2 3. CTRL 4. GPT-3 5. GPT-Neo / GPT-J-6B 三、Encoder-Decoder 家族 1. T5 2. BART 3. M2M-100 4. BigBird 前言 …

CSB ---> (XXE)XML基础

本来今天想更一下CSbeacon上线多层的内网机器的,但是刚好今天是年后的第一节课,讲的是XXE的基础,那就来先盘一下基础!! 1.XXE XXE全称是XML External Entity即xml外部实体注入攻击!其后果会导致用户…

不要抱怨,不如抱 Java 运算符吧 (1)

本篇会加入个人的所谓‘鱼式疯言’ ❤️❤️❤️鱼式疯言:❤️❤️❤️此疯言非彼疯言 而是理解过并总结出来通俗易懂的大白话, 小编会尽可能的在每个概念后插入鱼式疯言,帮助大家理解的. 🤭🤭🤭可能说的不是那么严谨.但小编初心是能让更多人…

Android 圆环带刻度条进度动画效果实现

效果图 需求是根据传感器做一个重力球效果,先实现了动画后续加上跟传感器联动. 又是摆烂的一天, 尚能呼吸,未来可期啊 View源码 package com.android.circlescalebar.view;import android.content.Context; import android.content.res.Typ…

【鸿蒙 HarmonyOS 4.0】数据持久化

一、数据持久化介绍 数据持久化是将内存数据(内存是临时的存储空间),通过文件或数据库的形式保存在设备中。 HarmonyOS提供两种数据持久化方案: 1.1、用户首选项(Preferences): 通常用于保存应用的配置信息。数据通…

sql server想要小数点后向下取整怎么搞

select FORMAT(3.169, N2) as 四舍五入1, CAST(3.169 AS decimal(9,2)) as 四舍五入2, ROUND(3.169, 2) as 四舍五入3, CAST(FLOOR(3.169 * 100) / 100 AS decimal(9,2)) as 向下取整1, FLOOR(3.169 * 100) / 100 as 向下取整2, ceiling(3.169 * 100) / 100 as 向上取整—…

vue中使用AraleQRCode生成二维码

vue中使用AraleQRCode生成二维码 问题背景 本文介绍vue中生成二维码的一种方案&#xff0c;使用AraleQRCode来实现。 问题分析 &#xff08;1&#xff09;安装对应的依赖包 npm i arale-qrcode --save &#xff08;2&#xff09;完整代码如下: <template><!-…

解决两个MySQL5.7报错

这里写目录标题 1.启动不了MySQL&#xff0c;报错缺少MSVCR120.dll去官网下载vcredist_x64.exe运行安装进入管理员CMD 2.本地计算机 上的 mysql 服务启动后停止。某些服务在未由其他服务或程序使用时将自动停止&#xff0c;Fatal error: Can‘t open and lock privilege tables…

什么是智慧公厕?智慧公厕建设的好处

智慧公厕是一种融合物联网、互联网、通信技术、大数据、云计算、自动化控制等信息化技术的新型公共厕所&#xff0c;通过传感器数据获取和分析优化业务流程&#xff0c;为公共厕所的监测、管理、控制提供全方位支持&#xff0c;实现公共厕所的环境监测与调控、厕位占用监测与引…

springcloud:2.OpenFeign 详细讲解

OpenFeign 是一个基于 Netflix 的 Feign 库进行扩展的工具,它简化了开发人员在微服务架构中进行服务间通信的流程,使得编写和维护 RESTful API 客户端变得更加简单和高效。作为一种声明式的 HTTP 客户端,OpenFeign 提供了直观的注解驱动方式,使得开发人员可以轻松定义和调用…

web前端安全性——CSRF跨站请求伪造

承接上篇讲述的XSS跨站脚本攻击 跨站请求伪造&#xff08;CSRF&#xff09; 1、概念 CSRF(Cross-site request forgery) 跨站请求伪造:攻击者诱导受害者进入第三方网站&#xff0c;在第三方网站中&#xff0c;向被攻击网站发送跨站请求。利用受害者在被攻击网站已经获取的注…

基于SSM的绿色农产品销售系统的设计与实现

随着电子商务在各行各业中的广泛应用,为更多的产品提供了销售渠道。但就目前来看&#xff0c;这些以工业产品为热销的大型综合性电商平台&#xff0c;农产品销售量很不理想。另外&#xff0c;市面上存在专门销售农产品的网站&#xff0c;大部分消费者没有形成在网上购买农产品的…