AI 如何重塑劳动力市场:基于 Claude 数据的深度分析

news/2025/2/11 18:34:53/文章来源:https://www.cnblogs.com/deali/p/18710298

前言

本文翻译自 Anthropic 今天发布的 The Anthropic Economic Index ,经济指数报告,这份报告基于 Claude 的数据对目前的 AI 使用情况做了汇总。

引言

在未来的几年里,人工智能系统将对人们的工作方式产生重大影响。因此,我们推出了 Anthropic Economic Index,这是一个旨在理解人工智能对劳动力市场和经济的长期影响的倡议。

该指数的初步报告提供了基于数百万匿名对话在 Claude.ai 上的首次数据和分析,揭示了 AI 在现代经济中如何融入现实任务的最新清晰图景。

我们还将开源用于此分析的数据集,以便研究人员可以在此基础上扩展我们的发现。制定应对劳动力市场即将发生的转型及其对就业和生产率影响的政策反应需要多种视角。为此,我们还将邀请经济学家、政策专家和其他研究人员就指数提供意见。

经济指数第一篇论文的主要发现是:

  • 今天,使用主要集中在软件开发和技术写作任务中。超过三分之一的职业(大约 36%)在其相关任务中至少有四分之一使用 AI,而大约 4%的职业在其相关任务中有四分之三使用 AI。
  • 人工智能的应用更倾向于增强(57%),即人工智能与人类能力协作并增强,而自动化(43%)则是人工智能直接执行任务。
  • 人工智能的使用在中等到高薪职业(如计算机程序员和数据科学家)相关的任务中更为普遍,但在最低和最高薪酬的角色中较低。这很可能反映了当前人工智能能力的局限性,以及使用这项技术的实际障碍。

以下为关于我们初步发现详情的说明。

AI 在经济中的使用情况及其应用,数据来源于 Claude.ai 的实际情况。数字表示与 Claude 相关的对话中涉及这些个别任务、职业和类别的百分比。

劳动力市场人工智能应用映射

我们的新论文建立在关于技术对劳动力市场影响的研究长河之上,从工业革命时期的珍妮纺纱机到当今的汽车制造机器人。我们关注人工智能的持续影响。我们不调查人们对人工智能的使用情况,也不试图预测未来;相反,我们拥有关于人工智能实际使用情况的第一手数据。

分析职业任务

我们的研究始于经济学文献中的一个重要洞见:有时关注职业任务本身比关注职业更有意义。工作往往共享某些共同的任务和技能:例如,视觉模式识别是设计师、摄影师、安检人员和放射科医生执行的任务。

某些任务更适合通过新技术自动化或增强,因此我们预计人工智能将被有选择性地应用于不同职业的不同任务中,并且分析任务——除了整个工作——将使我们更全面地了解人工智能如何融入经济。

使用 Clio 将人工智能应用与任务匹配

这项研究得益于 Clio 系统,该系统允许我们在保护用户隐私的同时分析与 Claude 的对话。我们在大约一百万条与 Claude 的对话数据集(具体为 Claude.ai 上的免费和 Pro 对话)上使用了 Clio,并利用它按职业任务组织对话。

我们根据美国劳工部所做的分类选择了任务,该部门维护着一个大约有 20,000 个特定工作相关任务的数据库,称为职业信息网络,或 ONET。Clio 将每个对话与最能代表对话中 AI 角色的 ONET 任务相匹配(该过程总结在下图)。然后我们遵循 O*NET 方案将任务分组到它们最能代表的职业中,并将职业分到一个小的整体类别集合中:教育和图书馆、商业和金融等。

该过程将我们的 Clio 系统与 Claude 的对话(严格保密;左上角)翻译成职业任务(右上角)以及从 O*NET 中提取的职业/职业类别(右上角)。然后,这些内容可以输入到各种分析中(底部行;下文将详细讨论)。

结果

人工智能按职业类型的使用。在我们的数据集中,采用人工智能最广泛的职业类别是“计算机和数学”类别,这主要涵盖了软件工程角色。向 Claude 发送的查询中有 37.2%属于这个类别,包括软件修改、代码调试和网络故障排除等任务。

第二大类别是“艺术、设计、体育、娱乐和媒体”(查询的 10.3%),这主要反映了人们使用 Claude 进行各种写作和编辑。不出所料,涉及高度体力劳动的职业,如“农业、渔业和林业”类别(查询的 0.1%),代表性最少。

我们也比较了我们的数据中的比率与每个职业在劳动力市场总体中出现的比率。比较结果如图下所示。

对于每种工作类型,与 Claude 相关的对话百分比以橙色显示,与在美国经济中从事该工作类型的工人百分比(来自美国劳工部的 O*NET 类别)以灰色显示。

人工智能在职业中的应用深度。我们的分析发现,很少有职业在其相关任务中广泛使用人工智能:只有大约 4%的工作至少有 75%的任务使用了人工智能。然而,人工智能的适度使用则更为普遍:大约 36%的工作至少有 25%的任务使用了人工智能。

正如我们所预测的,这个数据集中没有证据表明工作完全自动化:相反,人工智能在经济中的许多任务中得到了扩散,对某些任务群体的影响比其他群体更强。

人工智能使用和薪资。O*NET 数据库提供了美国各职业的中位薪资。我们将此信息添加到我们的分析中,使我们能够比较各职业的中位薪资以及它们相应任务中的人工智能使用水平。

有趣的是,低薪和非常高薪的工作在人工智能的使用率上都非常低(这些通常是涉及大量手工技巧的工作,如洗发师和产科医生)。在我们的数据中,使用人工智能最频繁的是那些处于中等到高薪水平的具体职业,如计算机程序员和文案撰写者。

年薪(x 轴)与涉及该职业的对话百分比(y 轴)的关系。一些具有代表性的职业被突出显示。

自动化与增强。我们还更详细地研究了任务执行的方式——具体来说,哪些任务涉及“自动化”(AI 直接执行如格式化文档等任务)与“增强”(AI 与用户协作完成任务)。

总体来看,我们看到了向增强的一点点倾斜,57%的任务进行了增强,43%的任务实现了自动化。也就是说,在超过一半的情况下,人工智能并没有被用来取代执行任务的人,而是与他们一起工作,参与验证(例如,双重检查用户的工作)、学习(例如,帮助用户获取新的知识和技能)以及任务迭代(例如,帮助用户进行头脑风暴或执行重复的生成性任务)。

Claude 对话中涉及增强与自动化的比例,以及每个类别内任务子类型的分解。子类型在我们论文中的定义如下。指令型:以最小交互完成任务委派;反馈循环:由环境反馈指导任务完成;任务迭代:协作完善过程;学习:知识获取和理解;验证:工作验证和改进。

注意事项

我们的研究为深入了解人工智能如何改变劳动力市场提供了独特的视角。但与所有研究一样,它也有重要的局限性。其中包括:

  • 我们无法确定使用 Claude 完成任务的人是在完成工作上的任务。有人向 Claude 寻求写作或编辑建议,可能是为了工作,也可能是为了他们作为爱好所写的小说。
  • 相关地,我们不知道用户是如何使用 Claude 的回复的。他们是否,例如,复制粘贴代码片段?他们是在核实回复还是无批判地接受它们?我们数据中显示的一些自动化可能实际上是增强:例如,用户可能要求 Claude 为他们写一份完整的备忘录(这看起来像是自动化),但之后又自己编辑了它(这将是增强)。
  • 我们仅分析 Claude.ai 免费和 Pro 计划的用户数据,而不是 API、团队或企业用户的数据。虽然 Claude.ai 数据包含一些非工作对话,我们使用语言模型过滤这些数据,使其仅包含与职业任务相关的对话,这有助于减轻这种担忧。
  • 大量不同的任务意味着 Clio 可能错误地分类了一些对话(请参阅完整论文,特别是附录 B,以了解我们如何验证分析的具体细节);
  • Claude 无法生成图像(除非通过代码间接生成),因此数据中不会提及一些创意用途
  • 鉴于 Claude 被宣传为最先进的编码模型,我们可能会预期编码作为一个用例会被过度代表。因此,我们不认为我们数据集中的用例是人工智能应用的一般代表性样本。

结论与未来研究

人工智能的使用正在迅速扩展,模型的能力也在不断增强。在相对较短的时间内,劳动力市场的状况可能会有很大的不同。因此,我们将随着时间的推移重复上述许多分析,以帮助追踪可能发生的社会和经济变化。我们将定期发布结果和相关数据集,作为 Anthropic 经济指数的一部分。

这类纵向分析可以让我们对人工智能和就业市场有新的认识。例如,我们将能够监控职业中人工智能使用深度的变化。如果人工智能仍然只用于某些任务,并且只有少数工作将人工智能用于其大多数任务,那么未来可能是一个大多数现有工作演变而非消失的世界。我们还可以监控自动化与增强的比例,为自动化变得越来越普遍的领域提供信号。

我们的研究提供了关于人工智能如何被使用的数据,但它并不提供政策建议。关于如何为人工智能对劳动力市场的影响做准备的问题的答案不能直接来自孤立的研究;相反,它们将来自来自广泛视角的证据、价值观和经验的结合。我们期待使用我们新的方法来对这些问题有更深入的了解。

阅读全文(译者注:论文在文末)以获取我们分析和结果的更多细节。

开放数据,征集意见

这篇论文和人类经济指数最重要的贡献是其新的方法论,提供了关于人工智能影响的详细数据。我们立即公开分享用于上述分析的数据库,并计划在将来有更多可用数据集时继续分享。

完整数据集可在此下载。(https://huggingface.co/datasets/Anthropic/EconomicIndex)

研究人员提供反馈和建议新研究方向的形式已在此。(https://docs.google.com/forms/d/e/1FAIpQLSfDEdY-mT5lcXPaDSv-0Ci1rSXGlbIJierxkUbNB7_07-kddw/viewform?usp=dialog)

致谢

我们感谢 Jonathon Hazell、Anders Humlum、Molly Kinder、Anton Korinek、Benjamin Krause、Michael Kremer、John List、Ethan Mollick、Lilach Mollick、Arjun Ramani、Will Rinehart、Robert Seamans、Michael Webb 和 Chenzi Xu 对论文早期发现和草稿的富有成效的评论和讨论。

原文

原文地址: https://www.anthropic.com/news/the-anthropic-economic-index

论文: https://assets.anthropic.com/m/2e23255f1e84ca97/original/Economic_Tasks_AI_Paper.pdf

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/882196.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Nacos Python SDK 强势来袭,动态管理大模型 Prompt!

Nacos 从 0.8.0 版本开始就一直参与 Python 生态建设,努力作为 Python 生态中分布式微服务发现和配置管理的解决方案一直往前演进。目前随着 AI 领域的发展,Nacos 社区的 Python 开发者用户越来越多,因此这次我们迭代了 Python 的 GA 稳定版本,对不少历史问题做了修复以及易…

踩坑记录-二分搜索的不同情况

二分搜索的不同情况 二分搜索可以用来查找满足条件的值,但是满足条件的值可能只有1个,也可能有多个。比如查找1的索引,对于【1,1,2,2】来说,就有2个。一般要求的就是:满足条件最大值/满足条件最小值。 二分搜索详细介绍可以参考:https://programmercarl.com/0704.二分…

《ESP32-S3使用指南—IDF版 V1.6》第五章 搭建开发环境

第五章 搭建开发环境 1)实验平台:正点原子DNESP32S3开发板 2)章节摘自【正点原子】ESP32-S3使用指南—IDF版 V1.6 3)购买链接:https://detail.tmall.com/item.htm?&id=768499342659 4)全套实验源码+手册+视频下载地址:http://www.openedv.com/docs/boards/esp32/AT…

内测之家介绍

内测之家:助力应用开发与迭代的专业平台内测之家是一款功能强大且全面的应用内测与管理平台,专为 iOS 和 Android 开发者打造,旨在为他们提供便捷高效、安全可靠的一站式服务。无论是从资源安全到传输安全,还是从数据保护到应用管理、统计分析,内测之家都展现出卓越的能力…

如何用好 AI 编码工具,让通义灵码帮你做更多工作

通义灵码,是阿里云与通义实验室联合打造的智能编码辅助工具,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释、研发智能问答、异常报错排查等能力,提供代码智能生成、研发智能问答能力。通义灵码,是阿里云与通义实验室联合打造的智…

用EXPLAIN检查SQL是否有慢查询

先看下面两张图: 图一 图二 同样都是查询语句,图一的条件采用的是模糊匹配,产生了全表扫面(type:a…

【触想智能】工控一体机在机械臂上应用的四大优势

随着工业自动化的发展,机械臂已成为现代制造业中不可或缺的一部分。为了使机械臂能够高效、精确地执行各种任务,工控一体机的应用变得越来越广泛。触想工控一体机在机械臂上的应用工控一体机是一种集计算、控制和通信于一体的高性能工业计算机,它不仅具备强大的计算能力,还…

CTFShow-Web167:

CTFShow-Web167:.htaccess利用 <button type="button" class="layui-btn" id="upload" lay-data="{url: upload.php, accept: images,exts:jpg}"> 限制上传类型为jpg文件 题目提示httpd,并且404页面返回Apache/2.4.25 (Debian…

对极几何(Epipolar Geometry)总结

为什么stereo很有用? 当我们需要从单一视角恢复结构时,我们的信息来源有以下几种: \(\bullet\) 从标定架可以获取标定架的位置 / 姿态以及相机内参 K。 \(\bullet\) 从无穷远点和线,加上正交的线和平面等信息,可以获取场景的结构和相机内参 K 。 但是由于内在歧义性,从单…

P10451 做题随笔

Solution 题意 原题链接 对每组数据,给定两颗用 01 序列描述的树,描述规则如下:按照 \(\text{DFS}\) 序进行遍历; 若序列中某位为 0,表示除根节点外的节点进栈;为 1 则表示出栈。要求判断一树是否可以通过交换子树的方式变换成另一子树(对于本题,即两树同构)。 分析 1…

堆排序--代码实现

本文主要说明代码编写思路和具体代码,下面的博文讲的比较全面 参考文章:https://www.cnblogs.com/jingmoxukong/p/4303826.html代码思路(以大根堆为例) 堆排一共分2个阶段:1. 创建一个大根堆 2.交换堆顶和堆尾元素,获取到堆顶元素,并重新维护大根堆 第一个阶段的思路: 从…