2024年企业级通用人工智能的关键技术趋势-编程知识

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/

在当今这个时代，企业级人工智能与众不同之处在于，它专注于可测量、受控制的产出，企业可以将其与自身品牌联系起来。今年，技术工具将主导舞台，使得通用人工智能（以下简称为“它”）克服挑战，成为一种可靠的工具，而不仅仅是潜力所在。

数据科学家在预测自己领域的未来方面确实很糟糕（这里有点自嘲！）。因此，对这些预测，请以95%的置信区间来接受 :)

转变资本支出周期这一块，现如今没有哪个企业不投资于“它”。

今年的某个时候，这些投资将开始要求回报。新技术的资本支出周期通常遵循18个月的规律：投资18个月，找到市场18个月，然后决定是否进一步开发以达到顶尖位置或转而投资于其他领域。虽然构建通用人工智能的概念验证是容易的部分，但将其投入生产却极具挑战性，鉴于幻觉问题、治理缺失、缺乏评估标准和架构混乱等问题。

到2024年秋天，我们将看到公司们努力为去年春天开始嵌入人工智能的一切找到产品市场契合点。这意味着一些企业将无法达标，而真正的强者将从人群中脱颖而出。这将意味着那些找不到产品市场契合点的公司将面临有关其投资和工作团队的艰难决定。

这是否意味着通用人工智能的泡沫即将破灭？远非如此。然而，我们将看到企业通过整合资源，不仅仅关注于概念验证项目，而是关注于他们打算在今年秋天结束之前投入生产的项目。那些没能做到的，将不得不要么展示出成果，要么剥离。

推理优化这一领域，在迄今为止的大多数通用人工智能的概念验证中，最被忽视的就是运行这些庞大的基于大型语言模型的推理的成本。

看似单位价格很小，但对于一个拥有几百万推理调用的中等规模公司来说，成本很快就会累积起来。今年的一个重点将是开发推理优化方法。这将是一个可以平衡成本效益权衡的领域，通过考虑各种因素如准确性、投资回报率预测、底层的本地云对比云基础设施对比软件即服务模型、大型语言模型的大小，以及它是否应该是检索增强生成或微调或自定义调整模型等。

至于想要利用“它”为客户增加价值的公司来说，关键在于如何利用其数据的独特性。这意味着使用检索增强生成或微调等方法来实现。

今年，我们还将看到对小型语言模型、中型语言模型和非常小的语言模型的兴趣激增，这些模型通常具有不到7亿参数，可以轻松地适应单个图形处理单元。我之前也在我的博客中写过这个话题：“为什么更大并不总是更好”。

“多”将是今年的关键词：多模型、多模态和多云。

对于任何企业来说，协调这么多选择将会产生一系列新问题。今年，人工智能领导者将需要解决几个挑战：

企业希望在其架构中支持多少个不同的大型语言模型？（记住，由于图形处理单元短缺，仅加载和推理一个340亿参数的大型语言模型就需要6个图形处理单元）。我们是否想要支持所有这些，还是选择更多的小型模型，或几个中等大小的模型，或一个大型和一个小型模型？
单一云运行风险高且昂贵，那么我们如何在多个云与本地大型语言模型之间管理工作负载？通常，本地模型部署从长远来看可以节省大量资金，并提供更好的治理和输出控制。
多模态——结合文本、图像、视频和音频将是一个值得关注的主题。部署这些多模态模型仍然是一个需要开发工具的领域。
如果有一个领域让顶级执行官们在通用人工智能方面夜不能寐，那就是人工智能治理。他们不知道何时他们的聊天机器人应用会提供错误信息，他们将不得不支付罚款（如加拿大航空的案例），或何时它会脱口而出仇恨内容并被撤下（如谷歌），或如何遵守新的一套规定，如欧盟法律。

所有公司都想知道的答案是，一旦将其投入生产后，它将如何运作。尚未解决的问题是“如何衡量”它。没有简单的度量或解决方案来衡量幻觉，特别是当涉及到没有普遍基准真相的特定领域数据（如政策）时。另一个挑战是为合规性而工具化，就像为审计目的一样。使黑盒变得开放和可预测是阻碍许多公司将他们的通用人工智能概念验证推向生产的一个挑战。

期待在私人和公共空间对这个问题进行大量讨论。希望美国国会能通过一些法律，行业能采纳一套类似于药物试验的通用标准。当然，大部分还是一厢情愿的想法，直到那时，像WatsonX.Governance这样的工具将是不可或缺的。

最后但同样重要的是，数据科学家的回归（或称为绝地武士）。

去年，似乎成为一个人工智能工程师就是从事人工智能工作所需的一切（一些误导性的新报道声称，成为一名人工智能工程师可以让你年薪90万到40万美元，而无需其他薪水）。

今年可能会慢慢意识到的最后一个变化是，数据科学家仍然非常需要，以将通用人工智能从潜力推向效能。

首先，两者有什么区别？传统的机器学习需要训练模型，数据科学家会利用他们的统计和算法专业知识来使模型适应你的用例。有了大型语言模型，你已经有了一个预训练的模型，所以人们认为你不再需要这样做了。无论你需要什么都可以通过提示调优来完成，这是一种聪明的英语写作。因此，人工智能工程师的数量增加了，他们不太关注科学部分，而是更多地专注于机器学习运维工程，以配置、集成和部署通用人工智能到应用程序中。

事实证明，现实要复杂得多，特别是对于企业级通用人工智能。以检索增强生成应用为例，为几十个文档构建检索增强生成很容易，但当涉及到几百万个文档时，你需要了解检索和重排算法（如KNN、编码器、BM-25）的深度知识。对于另一个用例，如text2sql，你需要技能来微调模型（比如PEFT、束搜索等）。此外，所有通用人工智能应用都需要评估模型的技能，并提出适合该数据集和用例的正确统计指标（如NDCG、Fleiss-Kappa）。所有这些意味着，统计和机器学习算法的核心技能仍然非常相关，仅仅组合起来是不够的。

因此，数据科学家将作为绝地武士回归，以使通用人工智能成为现实。核心统计技能将是你能多快提供高度准确的通用人工智能解决方案的关键因素。

期待意想不到的事情发生。人工智能的美在于它的不可预测性（这不是一个缺陷，而是一个特性，鉴于一切都建立在概率之上）。包括Sam Altman在内的每个人都未能预测当前的通用人工智能浪潮。我们首先看到的是2012年视觉模型的高峰和自动驾驶汽车的炒作。现在，又有了关于大型语言模型的另一波热潮。

所有企业都应该准备好，以迎接可能出现的任何意外。他们自己的计划可能会因为一些表现超出预期的新模型（如Llama3或GPT-5）或某些真正不同寻常的新事物而被推翻。一个新的模型、方法、数据集或服务器都可能颠覆现状。在通用人工智能领域，总是要期待意想不到的高潮和低谷。