2023春季李宏毅机器学习笔记 01 :正确认识 ChatGPT

资料

  • 课程主页:https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.php
  • Github:https://github.com/Fafa-DL/Lhy_Machine_Learning
  • B站课程:https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800

一、对Chatgpt的误解

常见误解

  1. 给出的回答不是已经准备好的(罐头回应×)
  2. 不是网络上搜索得出的答案(甚至有很多幻想出来的答案)

原理
在这里插入图片描述

二、预训练

ChatGPT:chat Generative Pre-trained Transformer
关键技术:

  • Pre-train(预训练)=Self supervised Leaarning(自督导式学习)
  • Foundation Model:基石模型
  • Fintune:微调
    在这里插入图片描述
    在这里插入图片描述

三、ChatGPT带来的研究问题

  1. 如何精准提出需求?
    目前使用的方法:Prompting
    创新点:有没有比人工尝试更加系统性的方法?
  2. 如何更正错误?
    目前没有较好的解决方法
    创新点:新研究题目Neural Editing
  3. 甄别AI生成的内容
  4. 泄露秘密、隐私信息
    创新点:新的研究题目:Machine Unlearning

四、文字冒险游戏

在这里插入图片描述

五、ChatGPT是怎么练成的?

ChatGPT的“兄弟”:InstructGPT,论文地址:https://arxiv.org/abs/2203.02155

ChatGPT学习四阶段

  1. 学习文字接龙
    不需要人工标注,在网络上收集语句,对输入句子(字)后面可以接的字进行概率统计,每次输出高概率的字(每一次输出都不同)

  2. 人类老师引导文字接龙方向
    人来思考问题,并人工提供答案(不需要很多,目的只是为了让GPT知道人们希望得到的答案)

  3. 模仿人类老师的喜好
    训练Teacher Model让希望输出的答案的“分数”大于其他输出

  4. 用增强式学习向模拟老师学习

六、延伸学习

分类
回归

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/316844.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【LeetCode-剑指offer】-- 13.二维区域和检索-矩阵不可变

13.二维区域和检索-矩阵不可变 方法:一维前缀和 初始化时对矩阵的每一行计算前缀和,检索时对二维区域中的每一行计算子数组和,然后对每一行的子数组和计算总和。 具体实现方面,创建 m 行 n1 列的二维数组 sums,其中 …

C#中汉字转区位码

目录 一、关于区位码 1.区位码定义 2.算法 二、实例 三、生成效果 四、程序中的知识点 1.byte[] GetBytes(string s) 2.字节数组转short类型 一、关于区位码 1.区位码定义 区位码是一个4位的十进制数,每个区位码都对应着一个唯一的汉字,区位码…

Find My查找大升级,苹果Find My可添加物品翻倍

Apple「查找」Find My可通过庞大的“Apple Find My Network” 实现全球查找功能。无数iOS、iPadOS、macOS、watchOS激活设备与Find My 设备结合在一起,无需连接到Wi-Fi或者蜂窝网络,用户也可以给遗失的设备定位。对于任何iOS、iPadOS、macOS、watchOS设备…

粒子群优化pso结合bp神经网络优化对csv文件预测matlab(3)

1.csv数据为密西西比数据集,获取数据集可以管我要,数据集内容形式如下图: 2.代码 这里参考的是b站的一位博主。 数据集导入教程在我的另一篇文章bp写过,需要的话可以去看一下 psobp.m close all clc%读取数据 inputX; outputY;…

windows下使用makefile编译c++程序

安装make https://www.mingw-w64.org/downloads/ 安装w64devkit版本,能使用一些类linux的命令如rm等 下载完成后解压压缩包,将bin目录添加到系统环境变量的PATH中 在cmd中验证使用make --version是否安装成功

多生产者-多消费者问题-第三十一天

目录 多生产者-多消费者问题 可不可以不使用互斥信号量? 当缓冲区的大小为2呢? 结论 多生产者-多消费者问题 多个不同类别的消费者和生产者,他们生产的和要消费的产品使不一样的 1、分析关系:找出题目中描述的各个进程&…

[足式机器人]Part2 Dr. CAN学习笔记-动态系统建模与分析 Ch02-1+2课程介绍+电路系统建模、基尔霍夫定律

本文仅供学习使用 本文参考: B站:DR_CAN Dr. CAN学习笔记-动态系统建模与分析 Ch02-12课程介绍电路系统建模、基尔霍夫定律 1. 课程介绍2. 电路系统建模、基尔霍夫定律 1. 课程介绍 2. 电路系统建模、基尔霍夫定律 基本元件: 电量 库伦&…

粘接PI膜除了使用PI膜专用UV胶粘接,还可以使用热固化环氧胶来解决!

热固化环氧胶也是粘接聚酰亚胺(PI)膜的一种常见方法。 热固化环氧胶是一种在加热的条件下固化成坚固状态的胶水,在涂抹或涂覆胶水后,通过加热,胶水中的化学反应被触发,导致其硬化和固化,从而形…

【linux kernel】linux的SPI框架分析

文章目录 一、linux内核中的SPI框架二、SPI核心的初始化三、SPI核心的数据结构1、struct spi_statistics2、struct spi_delay3、struct spi_device4、struct spi_driver5、struct spi_controller6、struct spi_res7、struct spi_transfer8、struct spi_message9、struct spi_bo…

【Leetcode】466. 统计重复个数

文章目录 题目思路代码 题目 466. 统计重复个数 思路 题目要求找出一个最大整数 m,使得经过 n2 个字符串 s2 组成的字符串能够被经过 n1 个字符串 s1 组成的字符串完全包含的次数。使用动态规划来记录每个位置匹配的情况,并通过循环节的分析来计算最…

kafka容灾演练的方案

背景 kafka可以通过MirrorMaker工具把集群的数据从一个集群同步到另一个集群,通过在另一个数据中心创建灾备集群的方式可以做到容灾的效果,但是如果我们不通过如此重量级的工具也想达到容灾演练的目的,可以怎么做呢 kafka简单容灾实现 当原kafka集群发…

2024最新最全【Xmind8】下载安装零基础教程【附安装包】

软件下载 软件:Xmind 版本:2023 语言:简体中文 大小:136.72M 安装环境:Win7及以上版本 ,64位操作系统 硬件要求:CPU2.0GHz ,内存4G(或更高) 下载通道①百度网…