AIGC 技术及应用初探

ChatGPT 相关话题近一年多来被刷爆,利用 AI 技术生成内容,引起了各行各业的关注。其实,自2022 年 4 月起,OpenAI、Google、Microsoft 相继发布了文生图模型,视觉创作就已经开始持续火热了。国内 AIGC 相关的技术和应用也在迅猛的发展,逐步走进人们的视野当中,并引起了极大的谈论度。

Q:ChatGPT、AIGC、AI、NLP 等这些概念之间究竟是什么样的关系呢?下面,本篇文章将会围绕 ChatGPT 展开讲起~

ChatGPT 周边

ChatGPT (Chat Generative Pre-Trained Transformer):  OpenAI 开发的聊天机器人语言模型,基于 GPT 3.5,GPT 3.0 是在 2020 年 6 月发布,使用 大型语言模型(LLM,Large Language Model)来训练,并把结果存储到 Transformer 的模型参数中。预先训练得到的通用语言模型,所以能力强大,”善解人意“,即刻答复。

ChatGPT 是生成式 AI 的一种形式,它使用的核心技术之一是 Transformer。

AIGC (AI Generated Content)      「内容生产」发展历程介绍

大模型有以下优点:

        1、效果好,可以提供强大的表示基础

        2、通用性,提供统一的建模方式

        3、泛化强,举一反三的少样本学习

因此大模型是适合 AIGC 的解决方案

NLP 简要介绍

  • 自然语言处理(Natural Language Processing,NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。

其中,由 Attention 机制向 Transformer 的发展是其中一个重大转变

标准的 Transformer 模型主要由两个模块构成:

  • Encoder(左边):负责理解输入文本,为每个输入构造对应的语义表示(语义特征
  • Decoder(右边):负责生成输出,使用 Encoder 输出的语义表示结合其他输入来生成目标序列。

虽然新的 Transformer 模型层出不穷,它们采用不同的预训练目标在不同的数据集上进行训练,但是大致上依然可以按模型结构将其分为三类:

  • 纯 Encoder 模型(例如 BERT),又被称为自编码 (auto-encoding) Transformer 模型;
    • ChatGPT 所依赖 GPT3.5 语言模型的的底层正是 Transformer
    • 上面所有提到的 Transformer 模型本质上都是预训练语言模型,它们都采用自监督的方式在大量的生语料 (raw text) 上进行训练。自监督学习是一种训练目标可以根据模型的输入自动计算的训练方法,不需要人工标注数据。
    • 纯 Encoder 模型只使用 Transformer 模型中的 Encoder 模块,也被称为自编码 (auto-encoding) 模型。在每个阶段,注意力层都可以访问到原始输入句子中的所有词语,即具有“双向 (Bi-directional)”注意力。纯 Encoder 模型通常通过破坏给定的句子(例如随机遮盖其中的单词),然后让模型进行重构来进行预训练,最适合处理那些需要理解整个句子语义的任务,例如句子分类、命名实体识别(词语分类)和抽取式问答。
    • 纯 Decoder 模型(例如 GPT),又被称为自回归 (auto-regressive) Transformer 模型;
    • Encoder-Decoder 模型(例如 BART、T5),又被称为 Seq2Seq (sequence-to-sequence) Transformer 模型。
  • 应用领域
    • 信息提取
    • 文本生成
    • 智能问答
    • 机器翻译
    • 情感分析
    • 语音识别
    • ......

大模型的应用类型

  • 图像生成

                                           题图:文心大模型绘制的一张照片

                题图:达摩院文生图大模型绘制的一张照片

  • 文本生成
  • 代码生成
  • 图文生产视频
  • ......

ChatGPT

ChatGPT 基于 GPT 3.5,目前的知识库还是 2022 年 1 月份之前的数据。

GPT 模型发展介绍

  • 2018年,GPT的提出,可称之为 NLP 的一个跨越式的发展。它提出了自然语言的一种新的训练范式。即可以通过海量的数据的「无监督学习」来训练一个语言模型。
  • 2019年,GPT-2
  • 2020年,GPT-3
  • 2022年,GPT-3.5
  • OpenAI 公司推出的 ChatGPT 与以往的公开提供服务的对话机器人相比,性能有了显著的提高。它可以相对可靠地提供一些日常对话、知识获取的功能,也可以它根据人类提供的需求帮忙写文档、写代码,甚至可以修改文本中的各类错误或者代码中的Bug。ChatGPT Transformer GPT 等相关技术发展的集大成者。

ChatGPT 性能卓越的主要原因可以概括为三点:

  • 使用的机器学习模型表达能力强。
  • 训练所使用的数据量巨大。
  • 训练方法的先进性。
  • 打辅助
    • 帮写邮件
    • 文章回答
    • 生产代码/技术选型 
    • ......

百度文心大模型

百度的「文心一言」已于 2023 年 3 月份完成内测,对公众开放。「文心大模型」包含了基础通用大模型,以及面向重点领域和重点任务的大模型。

  • 文心 ERNIE 3.0  文心大模型
  • 创作歌词体验 https://wenxin.baidu.com/wenxin/pc/lyric
  • AIGC-TTV (Text to Video)
    • 在线体验:百度智能云一念

创意应用

  • 文心一格 文心一格 - AI艺术和创意辅助平台
  • 晓晓写高考作文
  • 文心大模型 补全《 富春山居图 》
  • 文心 PLATO
    • 人机对话主要包括任务对话、问答对话、开放域对话 3 种 
    • 开放域对话:在开放场景中进行拟人的对话,要求人设、人格、情感、观点等维度的一致性;以多轮对话有趣、拟人为目标
      • 百度智能音箱,小度智能屏等

很多大模型面临的挑战

  • 知识不准确、知识时效性问题(很多「预训练模型」都存在的问题)
  • 情感抚慰=》心理咨询师 不可替代性(有哪些职业是 ChatGPT 无法取代的?)
  • 时间和日期感知
  • 行为能力控制(索要地址等)

AIGC 对各行业的影响

  • 从业者:高效工具
  • 企业:降本增效 

未来 AIGC 将产生哪些实用性的工具,又将如何影响我们的工作和生活,我们终将持续关注、持续学习,为我所用~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/617459.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python基础——类型注解【变量,函数,Union】

📝前言: 上一篇文章Python基础——面相对象的三大特征提到,python中的多态,python中,类型是动态的,这意味着我们不需要在声明变量时指定其类型。然而,这可能导致运行时错误,因为我们…

The C programming language (second edition,KR) exercise(CHAPTER 3)

E x c e r c i s e 3 − 1 Excercise\quad 3-1 Excercise3−1:输出结果如图1所示,这里故意让二分搜索算法去寻找一个在数组中不存在在的数,然后去看两种二分搜索算法分别所花费的时间的大小,为了使得所花费的时间更具有可分辨性&a…

SAP SD学习笔记05 - SD中的一括处理(集中处理),出荷和请求的冻结(替代实现承认功能)

上一章讲了SD的重要概念,比如出荷Plant(交货工厂),出荷Point(装运点),输送计划,品目的可用性检查,一括纳入/分割纳入,仓库管理等。 SAP SD学习笔记04 - 出荷…

机器学习—特征工程(三)

什么是特征工程 特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。 意义︰会直接影响机器学习的效果 特征工程的位置与数据处理的比较 pandas:—个数据读取非常方便以及基本的处理格式的工具sklearn:对于特征的处理提…

某网站sign签名参数与数据响应加密逆向分析

文章目录 1. 写在前面2. 接口分析3. 断点分析4. 扣代码 【🏠作者主页】:吴秋霖 【💼作者介绍】:擅长爬虫与JS加密逆向分析!Python领域优质创作者、CSDN博客专家、阿里云博客专家、华为云享专家。一路走来长期坚守并致力…

Nature Machine Intelligence 纽约大学团队提出基于深度学习和语音生成技术的脑电-语音解码

由于神经系统的缺陷导致的失语会导致严重的生活障碍,它可能会限制人们的职业和社交生活。近年来,深度学习和脑机接口(BCI)技术的飞速发展为开发能够帮助失语者沟通的神经语音假肢提供了可行性。开发神经-语音解码器的尝试大多数依…

大模型实战案例:8卡环境微调马斯克开源大模型 Grok-1

节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 汇总…

C语言 | Leetcode C语言题解之第19题删除链表的倒数第N个结点

题目: 题解: struct ListNode* removeNthFromEnd(struct ListNode* head, int n) {struct ListNode* dummy malloc(sizeof(struct ListNode));dummy->val 0, dummy->next head;struct ListNode* first head;struct ListNode* second dummy;f…

项目之旅(前两周)

文章目录 学习总结input1.text 文本框2.password 密码框3.button 按钮4.file 文件还可定义上传类型 5.日期6.radio 单选框7. checkbox 复选框 项目总结生活总结 学习总结 input 本次写项目时才发现,input有很多种用法,这里列举几种 1.text 文本框 不…

【问题篇】activiti工作流流程图更新后旧数据问题

互相学习交流 当我们使用activiti开发工作流时,项目上线后可能修改需求导致修改流程图也是很常见的情况。但是activiti更新流程图后,以前的流程实例并不会也跟着更新,activiti会保存每一份的流程图版本,只有新发起的流程实例才会…

Redis(二十一)高性能设计:epoll和IO多路复用深度解析

文章目录 概览举例结论 I/O多路复用模型概述Redis的IO多路复用Unix网络编程IO模型同步异步、阻塞非阻塞案例同步异步、阻塞非阻塞总结 BIO、NIO、多路复用BIO演示accept演示read痛点 NIOIO多路复用Redis多路复用模型Reactor设计模式 select,pol, epol 都是I/O多路复用的具体的实…

2024mathorcup妈妈杯C题数学建模无水印高质量论文新鲜出炉

以下展示部分正文内容:完整内容见文末名片 添加图片注释,不超过 140 字(可选) 添加图片注释,不超过 140 字(可选) 添加图片注释,不超过 140 字(可选) 添加图片…