AI和人工智能与机器学习全景报告

今天分享的是AI系列深度研究报告:《AI和人工智能与机器学习全景报告》。

(报告出品方:appen)

报告共计:30页

图片

图片

图片

获取

数据获取仍是AI应用构建团队的主要瓶颈。

原因各不相同。例如,特定用例的数据可能不足,新的机器学习技术需要更多的数据,或者并未建立轻松高效获取所需数据的适当流程。

受访者对AI生命周期数据管理的看法有着强烈的共识,即企业领导者了解AI生命周期数据管理的价值 (90%同意),AI生命周期数据管理正在改变本企业的的经营方式 (87%同意)。决策者在AI生命周期四个阶段会平均分配数据管理时间。7成 (71%) 的受访者表示本企业在AI生命周期的许多阶段都很纠结。

尽管大多数受访者(88%)认为本企业拥有AI各阶段数据管理的必要内部资源,但只有42%的技 术专家认为,AI生命周期的数据获取阶段很有挑战性。不过,认为数据获取很有挑战性的企业 领导者并不太多(24%)。这表明,在对AI生命周期数据管理最大瓶颈的认识方面,技术专家和企业领导者之间仍然存在分歧。这就导致企业内的优先事项与预算的错位。

要使AI解决方案正常运行,就需要大量高质量数据来训练底层神经网络。多语言自然语言处理 (NLP) 便是个很好的示例。NLP依赖于数百万人的语音输入,并以ML(机器学习) 模型可以接受的格式准备和输入。

虽然我们调查的受访者中有五分之四表示他们拥有支持AI项目所需的适当数据量(81%) ,并且可以使用完成AI相关工作所需的工具 (90%),但他们中的大多数人仍在为低劣的数据质量而苦恼。依靠如此数据生成的系统往往性能不佳。当在NLP中集成多模态,或连接支持多种语言和内容类型的多个独立NLP解决方案时,数据质量问题就成为一个更大的挑战。

图片

图片

图片

图片

质量

世界日新月异,随着越来越多的智能设备、多屏幕的使用和收集信息的新数字工具的出现,全球数字足迹产生的数据量迅猛增长准确地构建和标注数据比以往任何时候都更加重要。

51%的受访者认为,数据准确性对其AI用例至关重要,46%的受访者认为,虽然这点很重要,但也可以变通。但只有20%的受访者认为,数据准确率高于80%,而认为数据准确率超过90%的受访者只有6%。

在AI生命周期开始阶段就使用正确的数据,将使后续阶段获得更好的结果。用于管理和准备数据的平均时间比例呈下降趋势,今年的平均占时间为47.4%,而2021年这一数字为53%。由于大多数受访者都使用外部数据提供商,因此可以推断,通过外包数据获取和准备工作,企业的数据科学家正在节省时间,并正确管理、清理和标注数据。

平均而言,管理和准备数据的平 均时间比例呈下降趋势今年这一 数字为47.4%,而 2021年为53%。

AI计划的最大障碍是数据管理。

AI计划的最大障碍是数据管理,41%的受访者表示,数据管理是最大的瓶颈。紧随其后的是,39%的受 访者表示,缺乏合格的人才——数据科学家和技术专家、数据架构师和工程师稀缺。31%的受访者表 示,缺乏足够的人员编制预算,增加了数据管理团队人员配备的挑战。合格数据科学家和技术专家的 短缺凸显了确保关键人才专注从事需要其宝贵技能的工作的重要性。为了解决这一问题,企业希望利 用外部数据提供商减少本企业在数据获取等领域的工作量,为数据科学家省出时间从事其他AI项目。

图片

图片

图片

评估

机器学习模型需要持续监控和调整,以确保输出准确、相关的信息。

虽然部署后的模型基本上是自主的,但模型验证和再训练却需要人机协同。受访者对人机协同的重要性有着强烈的共识。81%的受访者认为,它非常重要或极其重要,97%的受访者认为,人机协同评估对于AI模型的准确性很重要。

AI生命周期是个持续的过程,需要不断地获取、准备和评估新的数据输入和模型输出。因此,有很多企业使用外部数据提供商 (88%) ,从我们衡量的需要持续更新模型的数据点中也可见一斑。去年,有86%的企业至少每季度更新一次模型,今年这一数字已增加到91%。

随着数据的及时更新,接下来就需要与外部数据提供商合作,找到合适的合作伙伴非常重要。92%的受访者认为,使用合适的数据合作伙伴对于成功的模型部署和验证至关重要,大多数受访者(83%)希望能够使用一个合作伙伴为AI生命周期的所有阶段提供支持。持续验证模型性能很重要,它对成功的模型输出至关重要。

携手具有技术和专业能力的合适合作伙伴对于获得高质量的结果至关重要。在AI生命周期各阶段, 技术和专业能力对于获得高质量的结果都很重要,93%的受访者对此表示同意,51%的受访者表示强烈同意。

人工模型评估在很大程度上分配的预算最少,40%的受访者表示,他们给AI生命周期的最 后阶段分配的预算最少。预算分配与人机协同的重要性之间存在差距。模型评估对于确保AI模型的准确性以及减少数据 量需求至关重要。预先对人机协同投入更多预算,企业将节约资金和时间,降低未来重新评估的可能性。

图片

图片

采用

2022年,AI的采用将继续实现增长,带来效益与应用,这源于企业创新以及提高效率和生产力的强烈愿望。

随着AI使用的日益普及,改善A的工具和最佳实践也变得越来越先进。

在疫情期间竞相推出AI之后,人们对企业AI先进水平的看法可能正在转变。我们的数据显示,认为本企业在业内领先的受访者有所下降 (对于美国市场,2021为66%,2022年为55%),这可能是由于疫情期间AI使用的大量涌现和各行各业AI用例的大量增加。虽然很少有受访者认为本企业在AI采用方面落后,但认为本企业领先的企业领导者(49%) 及和同行不相上下的企业领导者(49%) 数量不分伯仲。

与欧洲企业相比,美国企业更有可能表示其在采用AI方面领先于同行 (分别为44%和55%) 。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/217735.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【仿写实现move函数】

仿写实现move函数 一、值的类型 1.左值 描述:能够取地址的值成为左值 int a 10; const int b 15; int *pa &a; const int *pb &b;2.纯右值 描述:赤裸裸的字面值 eg(false , 3 , 12.23等) int a 13; int *p &a; //取a的地址 int …

数仓中数据清洗的方法

在数据采集的过程中,需要从不同渠道获取数据并汇集在数仓中,采集的原始数据首先需要进行解析,然后对不准确、不完整、不合理、格式、字符等不规范数据进行过滤清洗,清洗过的数据才能更加符合需求,从而使后续的数据分析…

力扣每日一题-统计和小于目标的下标对数目-2023.11.24

力扣每日一题:统计和小于目标的下标对数目 开篇 今天这道力扣打卡题写得我好狼狈,一开始思路有点问题,后面就是对自己的代码到处缝缝补补,最后蒙混过关。只能分享一下大佬的代码,然后我帮大家分享代码的思路。 题目链…

P12 C++静态关键字static

目录 01 前言 02 静态变量static 03 extern关键字 04 静态函数 最后的话 01 前言 static 关键字在 C 中有两个意思,这个取决于上下文。 第一种情况是在类或结构体外部使用 static 关键字,另一种是在类或者结构体内部使用 static。 类外面的 static…

【数据库】物理操作的一趟扫描算法机制原理,理解关系代数据与物理计划的关系,以及代价评估的应用和算法优化

一趟扫描算法 ​专栏内容: 手写数据库toadb 本专栏主要介绍如何从零开发,开发的步骤,以及开发过程中的涉及的原理,遇到的问题等,让大家能跟上并且可以一起开发,让每个需要的人成为参与者。 本专栏会定期更新…

红外遥控实验

本章,我们将介绍 STM32F103 对红外遥控器的信号解码。STM32 板子上标配的红外接收 头和一个小巧的红外遥控器。我们将利用 STM32 的输入捕获功能,解码开发板标配的红外遥控 器的编码信号,并将编码后的键值在 LCD 模块中显示出来。 红外遥控技…

BTC 复兴:Ordinals 带来创新活力,BitVM 与 BitStream 相继问世

除了备受瞩目的 ETF,今年 Bitcoin 生态迎来全新的发展活力和机遇。Ordinals 协议的横空出世,以此为基础诞生的 BRC20 协议给整个比特币生态带去了一波新的能量,迎来铭文热度高涨。而诸如 BitVM、BitStream 等新技术甫一问世,便引发…

MT6893_天玑 1200芯片规格参数介绍_datasheet规格书

天玑 1200(MT6893)是一款专为旗舰级全新5G芯片,它融合了先进的AI、相机和多媒体技术,为用户带来令人惊叹的体验。采用先进的6纳米制程设计,内置各种先进技术。该芯片采用旗舰级的八核CPU架构设计,支持16GB强大的四通道内存以及双通…

重庆数字孪生技术推进制造业升级,工业物联网可视化应用加速

重庆数字孪生、5G、人工智能、物联网、大数据等新一代信息技术的出现及终端计算设备的发展,带来了研发模式、生产模式、消费模式、体制机制的系统性变革,企业应该建设适应工业4.0时代发展要求的新型生产体系。巨蟹数科数字孪生智能工厂通过部署多样化用例…

初出茅庐的小李博客之C语言必备知识共用体

C语言必备知识共用体 共用体是一种构造数据类型,有时候也称之为联合体。 它的用途: 使几个不同类型的变量共占一段内存。 共用体举例 union 共用体名 { 类型标识符 成员名;类型标识符 成员名; };union data //共用体名字是data{ int i; …

leetcode刷题:17.电话号码的字母组合

leetcode原题网页 题目描述:给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。答案可以按 任意顺序 返回。 给出数字到字母的映射如下(与电话按键相同)。注意 1 不对应任何字母。 思路:使用vector&#x…

Guitar Pro软件8.0官方最新版本下载

Guitar Pro 8是一款由法国Arobas Music公司开发的吉他学习与MIDI音序制作辅助软件,它具有丰富的功能,包括吉他谱、六线谱、四线谱绘制、打印、查看、试听等方面,能够帮助音乐爱好者更方便地进行音乐学习和创作。Guitar Pro 8拥有独特的gtp格式…