中国信通院王蕴韬:从“好用”到“高效”,AIGC需要被再次颠覆

当下AIGC又有了怎样的颠覆式技术?处于一个怎样的发展阶段?产业应用如何?以及存在哪些风险?针对这些问题,我们与中国信通院云计算与大数据研究所副总工程师王蕴韬进行了一次深度对话,从他哪里找到了这些问题的答案。

2022年11月30日,ChatGPT正式面向全球发布,AIGC浪潮由此席卷而来。

实际上,AIGC技术由来已久。

1957年,Lejaren Hiller和Leonard Isaacson通过将计算机程序中的控制变量改为音符,用计算机创作了音乐作品《Illiac Suite》。

2014年,美国《洛杉矶时报》记者Ken Schwencke通过编写的算法程序,仅用3分钟就完成了当时洛杉矶发生的一场4.4级地震的新闻报道。

那么,当下AIGC又有了怎样的颠覆式技术?处于一个怎样的发展阶段?产业应用如何?以及存在哪些风险?

针对这些问题,我们与中国信通院云计算与大数据研究所副总工程师王蕴韬进行了一次深度对话,从他哪里找到了这些问题的答案。

大模型,再次唤醒AIGC

“和传统基于深度学习技术的AIGC相比,以GPT为代表的生成式大模型在去年年底的出现,直接将AIGC内容质量和好用程度提升到了一个新高度,AIGC这把火由此也再次被点燃。”这是王蕴韬看到的行业变化。

大模型的出现,对各个行业都带来了不可忽视的影响,AIGC产业也不例外。

这其中AIGC的“C”,不仅仅是指OpenAI的ChatGPT带火的“chatbot”中的文本内容,还包括诸如图片、视频、代码等内容形式。

尤其过往十年人工智能技术的快速发展,让人工智能技术在诸如图像/视频修复、低代码等领域有了一定的应用,大模型的到来才能进一步对这些产业形成一次颠覆。

关于这次对于人工智能的技术颠覆,王蕴韬将其中的直观感受总结为“可用”到“好用”。

对此,他进一步指出:

因为人工智能技术路线一直是在仿人类的神经元功能演进的,在这之中,我们经历了“低仿”到“高仿”的发展阶段。

此前基于深度学习的人工智能,是通过CNN、RNN网络,先是做一个线性变换,再经过一个激活函数,从而实现“低仿”人类神经元的算法模型。

现在再度火起来的AIGC背后的根技术是Transformer,有点类似编码器和解码器,通过将编码和解码放在一起,从而同时吸收更长的字符串(token)来做相关的任务处理。

从深度学习到现在的大模型,我们用的依然是广义上的深度神经网络,只不过这个深度神经网络基本单元发生了变化。

大模型的出现,改变了构成AIGC的基本单元,让AIGC从“可用”跨越到了“好用”阶段。

AIGC造“血”,行业内容涌现

2023年是大模型的战场,在这个战场上,悄悄进行了两场军备竞赛。

第一场是关于通用大模型,包括国外的微软、谷歌、亚马逊,以及国内的BAT等科技巨头,都加入到了这场竞赛中。

他们通过引入规模庞大的公开数据集、通过预训练,形成了通用大语言模型。

王蕴韬称,这个通用大语言模型,实现了大模型从0到1的构建,但实际上是“0.5版大模型”。

之后在行业大模型的竞赛中,真正适合深入到应用阶段的大模型才开始出现。

关于后者,王蕴韬称,大家主要是基于“0.5版大模型”在微调,通过不断灌输行业知识,增加与人类专家的交互,从而将“0.5版大模型”调试得更加好用。

经此“历练”,AIGC最终有机会进一步深入到各个行业,为各行各业造“血”。

“所有行业都需要生产内容,实际上,如今的AIGC已经在金融、电商、影视、传媒等领域开始被规模应用。”

以影视和传媒领域为例,这一领域各类机构和企业的核心竞争力就是提供内容,这些机构如果能够通过AIGC低成本高质量生产内容,必然会形成一次产业颠覆。因此,我们能够看到,现在影视行业已经在用AIGC进行后期制作,例如AI换脸就是已经被大家熟知的热门应用。

再如在电商领域,其中的直播带货、客服咨询等环节所需要内容服务都是AIGC最擅长的,而AIGC在电商内容生成上已经达到了非常理想的效果,尤其是人类很难实现的诸如直播带货中的24小时不间断货品推荐,已经在通过AIGC来实现。

据王蕴韬的观察,“实际上,在教育、工业、医疗、法律、农业、设计、软件,软件编写上,AIGC也确实已经遍地开花。”

大模型评估标准难题

AIGC及其背后大模型的到来带来的另一个难题是,如何建立起一套全新的评判标准。

在此之前,AI模型和算法经过几十年的发展,已经形成了一套成熟的评判标准,不过王蕴韬告诉我们,这套标准并不适用于现在的AIGC和大模型。

此前学术界会先搭建一个评测数据集,通过将这个数据集放到不同模型中并对比输出结果,以及与相对原有数据集的差异,从而判断AI模型的能力,诸如斯坦福等高校都是这方面权威评测机构。

然而,“这样的评测方法仅适用于原来判别式的AI模型,无法对现在生成式AI有一个很好的评测效果。”

从目前来看,国内对于大模型和AIGC一些场景应用的评测及标准,尚且处于探讨和研究阶段,据王蕴韬透露,“信通院专门针对大模型和AIGC的评测评估标准做了不少探索性工作,但目前这些标准主要还是围绕功能性指标,包括一个AIGC应用全生命周期实现哪些功能,这一块我们已经梳理出来了。”

但是针对AIGC背后大模型的性能有怎样的突破,这仍是一个行业难题。

“大模型每次生成的东西都会有明显的差异,如何判断每次输出都不一样的开放性输出和预想的输出的契合度有多少,这是目前评测最难实现的点。”

王蕴韬表示,“目前我们只能通过主观评价指标才能确定大模型究竟在性能上有多少提升,而针对相似度评估,整个产业界依旧非常欠缺。”

除此以外,王蕴韬还特别指出,如何让大模型可管、可控,安全地工作,同样是现在亟需解决的一个问题。

尤其是对于实时性、安全可控有高要求的行业和场景,现在尚且难以很好地应用AI大模型,“因为你完全无法预料大模型会输出怎样的结果。”

实际上,早在2021年,大模型刚刚兴起时,产学研各界就已经注意到了人工智能的安全可信,“我们当时做出过一个判断:人工智能已经进入到产业发展和治理重要度相同的新阶段。”

“原来大家都只是盯着产业发展,只踩油门,不踩刹车,现在来看,因为它在赋能垂直行业过程中会产生很多伦理相关的问题,确实已经进入到了一个新阶段。”

正因如此,在大模型进入对地域性、安全性较高的行业时,也出现了私有大模型这样独特的应用,尤其在数据安全越来越被重视的当下,私有大模型也成了通用大模型、行业大模型之外,一个更具时代特色的大模型。

现在全球对于到底什么样的AI是合乎科技伦理的、是可信的已经基本达成一定的共识,但是现在需要将这些宏观的、抽象的要求转化为企业真正在开发产品时落实的一个准则。

AIGC需要被再次颠覆

大模型带来的技术颠覆,为人工智能技术创新带来了新的范式,但第一波赚到钱的,依然是“卖铲子的人”。

王蕴韬表示,“通过堆算力的方式‘堆出来’的大模型效果已经很不错,但从商业角度来看,训练成本和推理成本之高,消耗电量和算力之大是难以想象的。因而,现阶段大模型解决的问题带来的效益远比它的成本投入要低。”

王蕴韬认为,针对大模型的商业化,接下来还需要供需方朝着两个方向发力:

第一,从供给侧来看,现在的大模型还有进一步压缩成本、提高性价比的空间。

大家已经意识到了以Transformer为代表的根技术还存在很大的问题,例如每增加一个token,它需要的算力是呈指数级增长的,对于由此带来的成本,同样如此。因此,从供给侧来看,目前仍然有很大的提升空间。

第二,从使用侧来看,现在AIGC做得最好的往往是企业自身数字化转型程度很高的,提升自身数字化程度也就成了企业高效应用AIGC的一个必然前提。

如果想要在更广泛的领域去应用AIGC技术,我们就需要这些领域在自己的数字化方面有更好的基础建设,这个基础的提升同样需要大量的资金、人力和时间的投入,先拥有更高数字化建设基础的企业和行业,也将先受益于AIGC技术红利。

而谈到当下大模型的技术路径,王蕴韬也特别指出,现在已经有高校和机构意识到了商业化的问题,开始思考区别于Transformer的新的技术路线。

他指出,“从‘好用’到‘高效’,AIGC在未来也许会再经历一次或多次技术范式的颠覆。” 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/217188.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于单片机的智能鱼缸(论文+源码)

1.总体设计 在本次设计中,其系统整个框图如下图2.1所示。其主要的核心控制模块由单片机模块,LCD显示模块,喂食模块,蜂鸣器模块,按键模块,复位电路,抽水电路,加热电路,加…

【报错栏】(Vue) Invalid handler for event “click“: got undefined

Property or method "add" is not defined on the instance but referenced during render. 翻译: 属性或方法“add”未在实例上定义,但在渲染期间引用。 Invalid handler for event "click": got undefined 翻译: …

Acrel-2000电力监控系统在上海大世界保护修缮工程项目中的应用

摘要:安科瑞生产厂家1876150/-6237黄安南 介绍上海大世界电力监控系统,采用智能电力仪表采集配电现场的各种电参量和开关信号。系统采用现场就地组网的方式,组网后通过现场总线通讯并远传至后台,通过Acrel-2000型电力监控系统实现…

2023-11-24--oracle--实验--[Merge 语句]

oracle--实验---Merge语句 1.认知Merge 语句 • merge 语句是 sql 语句的一种。在 SQL server 、 Oracle 数据库中可用, MySQL 中不可用。 • merge 用来合并 update 和 insert 语句。目的:通过 merge 语句,根据一张表( 原数据表…

2、分布式锁实现原理与最佳实践(二)

常见分布式锁的原理 4.1 Redisson Redis 2.6之后才可以执行lua脚本,比起管道而言,这是原子性的,模拟一个商品减库存的原子操作: //lua脚本命令执行方式:redis-cli --eval /tmp/test.lua , 10 jedis.set("produ…

前缀和+哈希表——560. 和为 K 的子数组

文章目录 🪐1. 题目🌟2. 算法原理⭐解法一:暴力枚举⭐解法二:前缀和哈希表 🌞3. 代码实现 🪐1. 题目 题目链接:560. 和为 K 的子数组 - 力扣(LeetCode) 给你一个整数数组…

python与C++与TensorRT的绑定

绑定的起因 Jetpack中的TensorRT不能直接在python3.8环境中使用,所以我们需要对TensorRT利用pybind11对python相进性绑定。 绑定的官方链接如下:点击这里 这个是8.2版本的,你可以使用其他版本也是可以的。 整个过程可以在虚拟环境中完成,主要是想最后的whl文件 在Jetson…

基于springboot实现高校食堂移动预约点餐系统【项目源码】

基于springboot实现高校食堂移动预约点餐系统演示 Java语言简介 Java是由SUN公司推出,该公司于2010年被oracle公司收购。Java本是印度尼西亚的一个叫做爪洼岛的英文名称,也因此得来java是一杯正冒着热气咖啡的标识。Java语言在移动互联网的大背景下具备…

数组题目: 665. 非递减数列、453. 最小移动次数使数组元素相等、283. 移动零、189. 旋转数组、396. 旋转函数

665. 非递减数列 题解&#xff1a; 题目要求一个非递减数列&#xff0c;我们可以考虑需要更改的情况&#xff1a; nums {4, 2, 5} 对于这个nums&#xff0c;由于2的出现导致非递减&#xff0c;更改的情况就是要么4调到<2&#xff0c;要么2调到4,5. nums {1, 4, 2, 5} …

P10 C++类和结构体的区别

目录 01 前言 02 struct 与 class格式上的区别 03 struct 与 class 使用上的区别 04 常用的代码风格 01 前言 今天这期我们主要解决一个问题&#xff0c;就是 C 中的类和结构体有什么区别。 本期我们有两个术语&#xff0c;结构体 struct&#xff0c;它是 structure 的缩写…

一篇文章让你入门python集合和字典

嗨喽~大家好呀&#xff0c;这里是魔王呐 ❤ ~! python更多源码/资料/解答/教程等 点击此处跳转文末名片免费获取 一、集合: 增加 add 删除 del 删除集合 discard(常用)删除集合中的元素 &#xff0c;删除一个不存在的元素不会报错 remove 删除一个不存在的元素会报错 pop随…

每日一题 1457. 二叉树中的伪回文路径(中等,DFS)

一句话&#xff0c;深度搜索所有路径&#xff0c;判断路径是否伪回文 # Definition for a binary tree node. # class TreeNode: # def __init__(self, val0, leftNone, rightNone): # self.val val # self.left left # self.right right clas…