从四个角度全面认识 ChatGPT

在这里插入图片描述

    • 传统语言模型是什么样的?
    • ChatGPT 涌现出了哪些新能力?
    • 这些能力都是怎么做到的?
    • 在 ChatGPT 大模型时代,我们应该怎么做?


当下最引人注目的语言模型 ChatGPT 如火如荼,主要还是因为其能力远远超越了传统模型。本文将对 ChatGPT 与传统模型进行对比,深入探讨 ChatGPT 具备的强大能力以及其背后的技术来源。此外还将介绍面对大语言模型时代我们应该如何去做。

传统语言模型是什么样的?

传统语言模型的实现机制其实很简单,我们可以将它理解为“文字接龙”,当我们输入一个词之后,模型会帮我们去预测下一个词是什么,将这两个词拼接之后继续预测,如此往复就形成了一段一段的整句对话。

那么语言模型究竟是如何学会人类语言机制的呢?当我们向它询问某一个问题时,这个问题就作为了语言模型的输入内容,同理它会去预测下一个单词或字符。每一组这样的数据组合都可以称为一个范例,当这样的范例足够多以后,大预言模型就会涌现出一个新能力:泛化。也就是说同一个问题,它可以自行拓展,比如说我们问:“床前明月光的下一句是什么?”模型回答“疑是地上霜”,这是正确答案。那么这时候如果将问题稍微拓展:“床前明月光的后续内容是什么?”模型也可以理解并处理,这就是所谓的泛化能力。当然这个能力是需要一个长期的训练过程和大量的数据作为支撑的。

过去一直以来的语言模型都是遵循以上机制的,讲的直白一点其实就是一个“文字接龙”机器,你问出的问题它会有对应的答案,即使换个问法可能也是该答案。相信每个人都体会到过某宝/某多/某东的机器人客服,你问一个问题它是这么回答的,换个问法它还是同样的话术,就说气不气。事实上这样的产品就是传统语言模型的典型代表。

ChatGPT 涌现出了哪些新能力?

在 ChatGPT 出世以后,与传统语言模型完全不一样了,ChatGPT 给我们的感觉就是它可以像真人一样和人正常聊天,回答各种各样的问题,甚至能理解人的感情… 很多全新的能力涌现了出来。

第一 ChatGPT 好像 全世界的知识它都会,上知天文下知地理,我们可以向它提问各领域的知识,让它帮我们写代码、写稿子等等。

case1:让 ChatGPT 讲解量子力学知识
插图(提问ChatGPT)
case2:让 ChatGPT 讲解天文学知识
在这里插入图片描述
case3:让 ChatGPT 帮我们写一段 python 代码,调用 ChatGPT
在这里插入图片描述
在这里插入图片描述
python 语言调用 ChatGPT 模型代码如下:

import openaidef chat_with_gpt(prompt):# 设置你的OpenAI API密钥openai.api_key = 'YOUR_API_KEY'# 调用ChatGPT进行对话response = openai.Completion.create(engine='text-davinci-003',prompt=prompt,max_tokens=100,temperature=0.7,n=1,stop=None,temperature=0.7,top_p=1,frequency_penalty=0,presence_penalty=0)# 获取模型的回复reply = response.choices[0].text.strip()return reply# 提示用户输入对话的起始语句
user_input = input("请输入你的问题或对话的起始语句:")# 调用ChatGPT进行对话
gpt_reply = chat_with_gpt(user_input)# 打印模型的回复
print("ChatGPT回复:", gpt_reply)

第二 ChatGPT 具有 接受“被催眠”的能力,所谓“被催眠”,就是当我们不停的告诉 ChatGPT 它是谁、它的特长是什么、它应该做什么事时,它自己就会开始按着这个逻辑去思考。当下的新型职业提示工程师就是基于此能力。

第三 ChatGPT 具有 复杂的推理能力,按道理来说“推理”应该是只有人才能做到的事情,但是现在 ChatGPT 也具备此能力,它也可以根据语义自行推理。

case4:输入一个公考推理题,让 ChatGPT 来解答
在这里插入图片描述
第四 ChatGPT 具有 中立、客观、安全的语言表达能力,当我们询问问题时,ChatGPT 的回答往往是准确客观且非常具有条理性的,同时它也会在一些涉及不良影响的问题上拒绝回答。

case5:询问当下最具潜力的创业项目
在这里插入图片描述

这些能力都是怎么做到的?

ChatGPT 能懂得全世界几乎所有的语言,是以海量的知识和数据作为基础的。简单来说就是将近乎所有的语料(文本)送进大语言模型当中,然后让它去预测下一个词汇是什么,与传统语言模型不同的点在于 ChatGPT 接触的预料数据是极其庞大的。下面这张表是 ChatGPT 历代版本的学习资料与模型大小:

OpenAI学习资料参数量
GPT15GB1.17亿
GPT240GB15亿
ChatGPT45TB+1750亿+

从始至终语言模型的训练机制都没有变,变的只是模型的量级。俗话说“量变引起质变”,相较于传统语言模型,ChatGPT 便是一个质的改变。

ChatGPT 的复杂推理能力源于“分治思想”,将一个大问题分解为一个个的小问题,逐步解决。

为语言模型灌输知识以及其“分治”的问题处理方式,这也就是我们常说的预训练。但是预训练之后也产生了一个问题:由于预训练接触了太多的数据信息,导致模型的回答没有约束,什么都说,不管好的还是不好的!

所以接下来就需要对语言模型进行规范、矫正,让它可以按照我们期望它输出的样子进行输出。具体的方式就是将一大堆人工标注好的范例输入到语言模型当中,这里所说的“人工标注好的范例”是指人为处理过的一些数据,包括答题要求和标准答案等。通过这些范例的大量输入告诉 ChatGPT 应该如何回答。

经过以上三个方面的训练之后,ChatGPT 就已经可以很规范的回答我们的问题了。当然至此想让它具有中立、客观、安全的语言描述能力还是不够的,还需要对 ChatGPT 进行最后的创意引导,具体的做法就是让任何用户对它进行自由提问,然后 ChatGPT 无干预的自由回答,最后人工告诉它哪个回答的好,哪个回答的不好,并分别给予奖励/惩罚。这些做法是在规范 ChatGPT 的表现,使它尽可能的作出符合人类认可的回答。

综上,ChatGPT 大语言模型的训练过程为:预训练→模板规范→创意引导。正是这三个步骤,再基于超大规模的数据造就了今天的最强语言模型 ChatGPT。

在 ChatGPT 大模型时代,我们应该怎么做?

万物都是有两面性的,拥有强大能力的 ChatGPT 也无可避免的存在着一些缺陷:

  • 可能会胡编乱造;
  • 可能会混淆,把一个人身上的事情用到另一个人身上;
  • 无法直接操作,我们没有办法像操作数据库一样去操作它;
  • 还存在一定的安全隐患,如某些机密性的信息;
  • 更新效率低;
  • 无法把语言和现实进行映射。

即使再强,也还有着很大的优化空间。事实上目前还有不少人对 ChatGPT 存在着抵触心理,因为在他们的认知中,ChatGPT 会造成大量的人员失业甚至是替代人类。但我想说的是ChatGPT 并不会让你失业,熟练使用 ChatGPT 的人才会让你失业。我们应该做的是拥抱科技、拥抱 ChatGPT,接受它并优化自己的学习方法,终身学习。

只有我们自身加入到科技发展的进程中,才不会被科技发展所淘汰。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/5564.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux5.9 MySQLMHA高可用配置及故障切换

文章目录 计算机系统5G云计算第四章 LINUX MySQL MHA高可用配置及故障切换一、概述及原理1.什么是 MHA2.MHA 的组成(工作原理)3.MHA 的特点 二、MMM(Master-Master replication manager for MvSQL,MySQL主主复制管理器&#xff09…

Win 10 重装系统(PE方式)

前言: 最近这个笔记本(ThinkPad E480,使用了四年左右)用起来很卡,经常开机状态时,合上之后,再打开屏幕就卡死了,鼠标和键盘按了都没有反应,无奈之下只能强制按电源关机后…

大数据Doris(四十八):Steam Load案例和注意事项

文章目录 Steam Load案例和注意事项 一、Steam Load案例 1、准备数据 2、创建 Doris 表 3、创建 Stream Load 导入任务 4、查看任务 5、查询Doris 表结果 二、注意事项 Steam Load案例和注意事项 一、Steam Load案例 下面以导入Linux节点本地磁盘数据到Doris为例&…

爆肝整理,性能测试-测试工具选型(各个对比)卷起来...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 性能测试和功能测…

SciencePub学术 | 算法类重点SCIEEI征稿中

SciencePub学术 刊源推荐: 算法类重点SCI&EI征稿中!2区闭源好刊,对国人非常友好。信息如下,录满为止: 一、期刊概况: 算法类重点SCI&EI 【期刊简介】IF:6.0-6.5,JCR2区,中…

gcc编译过程详解

以一个简单的C代码为例,详细讲解gcc整个编译过程。 1、预处理 主要处理#开头的东西,例如头文件处理、条件编译处理、将宏定义进行替换,还可以去掉注释、添加行号等。预处理的命令如下: gcc -E hello.c -o hello.i #-E表示预处理…

Jenkins 持续集成:Linux 系统 两台机器互相免密登录

背景知识 我们把public key放在远程系统合适的位置,然后从本地开始进行ssh连接。 此时,远程的sshd会产生一个随机数并用我们产生的public key进行加密后发给本地,本地会用private key进行解密并把这个随机数发回给远程系统。 最后&#xf…

MeterSphere(基于JMeter)常用断言汇总

JSONPath方式断言 {"success": true,"errCode": null,"errMessage": null,"statDate":"6月28日","data": [{"name": "人口","value": "1","unit": "万人…

安装 Prometheus 指标存储 观测 dubbo /windows_exporter指标 windows 版本 其他系统换个语法思路一样

目录 下载 Prometheus 访问Prometheus Targets 发现服务 对应的 dubbo 指标就出来了 Dubbo脚手架生成个最简单的项目 导入 Prometheus 相关包 或者使用这个包即可 启动后就自动上报指标了 Windows_exporter or node_exporter 端口 9182 Prometheus 配置 windows_exp…

『手撕 Mybatis 源码』11 - 二级缓存

二级缓存 概述 启用二级缓存需要进行三步配置 开启映射器配置文件中的缓存配置 <settings><!--cacheEnabled值默认就为true--><setting name"cacheEnabled" value"true"/></settings>在需要使用二级缓存的 Mapper 配置文件中配…

【嵌入式Qt开发入门】在Ubuntu下编写C++

在 Ubuntu 上面编写 C&#xff0c;本文内容主要介绍在 Ubuntu 在终端窗口下使用 vi/vim 编辑一 个 C源文件。通过编写最简单的示例“Hello,World&#xff01;”。带领大家学习如何在 Ubuntu 终端下编辑和编译 C。这里要求大家会在 Ubuntu 上使用 vi/vim&#xff0c;也就是要求大…

迪赛智慧数——柱状图(象形动态图):高考填报专业考虑的因素

效果图 填报志愿是高考后的一大重要环节&#xff0c;你的职业生涯就在这里起航了。那么&#xff0c;应该怎么填报志愿呢&#xff1f;高考填报专业考虑的因素很多&#xff0c;过半的人会考虑专业就业前景及薪资&#xff0c;其次是个人兴趣和是否为双一流建设学科。 数据源&…