你可能听说过这样一个统计数据:超过 80% 的人工智能(AI)项目未能成功部署。虽然我们预计未来几年这一数字会有所下降,但与此同时,企业依然拥有非常现实和常见的成功障碍。缺乏高质量的数据、缺乏技术专长、企业内部难以协调一致,都是计划部署 AI 的企业面临的重大挑战的实例。 好消息是,越来越多的企业正在研究解决这个问题,想方设法让 AI 为他们的业务服务,并大规模部署各种解决方案。正在构建 AI 的企业应该从这些成功案例中获取经验。有了合适的基础设施和适当的工具,就可以最大限度地提高战胜 AI 挑战的几率。
应对 AI 挑战的五步计划
虽然并未详细地列出模型构建流程的每个步骤,但下文针对期望部署高性能 AI 模型的团队提出了五条关键建议。
第一步:选择正确的问题并评估投资回报率(ROI)
AI 从业者通常会因为在不知不觉中选择了使用 AI 来解决错误的业务问题,而使项目一开始就陷入困境。他们选择的问题可能太广泛而无法有效解决,也可能最终成本太高,或者根本不需要 AI 来解决。避免这一障碍意味着要前期做好评估审查。 专家建议在开始AI项目之前,设置一个探索发现阶段,由业务和技术团队在此阶段共同选择要解决的问题、确定解决方案、衡量该问题的可用数据,并计划从何处获取更多数据。在此阶段,从多个角度评估潜在的投资回报率:这项工作对发展业务是否必不可少?期望通过成功完成这项工作实现什么目标?(节省成本?增加额外收入?) 在这个过程中,你可能会发现你们无法获得所需数据,因此只能选择其他不以数据为基础的解决方案;或者你会发现你们想的解决方案其实并不能解决问题,或有较低的投资回报率。在这个阶段可能会发现很多问题,因此一定要尽可能澄清所有问题,并多部门联合确定策略。
第二步:弥合业务领导者和技术领导者之间的分歧
在部署 AI 方面,尽管近年来取得了一些进展,但企业领导者和技术负责人之间的理解仍然存在分歧。尽管困难,但企业中的所有重要决策者都需要了解AI的功能和局限性:AI不是万能药,在创建AI解决方案的时候,会有很多不确定性和更多的问题。 在开始部署之前,需要明确项目预期,并让所有企业重要领导人和决策者,包括C级别的高级管理者,都了解这个项目想要解决什么问题,以及部署的过程和步骤。 例如,业务领导者需要理解,AI构建不是一个一次性的过程,而是需要不断迭代更新;随着项目的进展,AI的成本会逐渐增加,因为模型需要持续不断的数据投入来进行测试和训练。领导人的理解有助于项目的资源整合。如果你是第一次部署AI项目,记得要选择能够简单说明其价值的项目,这样你在获得资源方面会更加顺利。
第三步:协调各个技术团队
在企业的技术部门内,开发运维团队(DevOps)、IT 团队和数据科学家之间通常仍然存在分歧。通常,这些团队各自为政;例如,IT 通常不太熟悉 AI 的具体细节。然而,对于 AI 项目,所有这些团队都发挥着重要作用。在启动 AI 项目之前,必须把这些独立作战的团队联合起来。一些企业会从不同的技术部门抽调人才,共同组成一个AI项目小组,而这需要高层管理人员的支持才可能做到。因此,我们就回到了第二个问题:一定要在一开始就获得上层的同意,这对项目的完成非常重要。
第四步:投资于数据
开展以数据为本的人工智能开发,意味着要注重对数据质量的投资。与模型表现关系最为密切的是数据质量,而不是模型的复杂程度等其他因素。即使在AI成功部署后,也需要持续不断的投入数据来适应实际数据发生的变化。投资数据,并且确保所有主要决策者都了解这一点的重要性,将很大程度地促进你的成功。 采集和准备训练数据也是模型构建过程中最耗时的阶段。 在数据采集阶段,可能需要从多个来源获取数据、与数据供应商合作或创建合成数据来满足所有用例的要求。在数据准备阶段,你需要清理数据并进行准确标注。如果后者需要使用技术专家,请聘请这类标注专家或与可提供采集和标注的数据供应商合作,并在计划中标明这一点。 由于创建高质量的数据需要大量的精力和时间投入,因此应该尽可能在该领域实现自动化。创建工作流程以持续清洗、标注和监控数据。如果需要,利用可以定制的开源工具。
第五步:准备进行迭代
构建 AI 是一个高度迭代的过程。例如,可能需要循环测试多个模型,才能找到最适合你的解决方案的那一个。在部署应用之前,需要在新数据、超参数、特性和其他控制变量下反复测试模型。即使在部署之后,模型也可能在生产环境中遇到新的和不可预见的数据,并且需要新的训练。因此,整合全面的数据流程,不断地在新数据上重新训练模型,就显得至关重要。 最后,还可能会出现意想不到的情况。在生产环境中可能会出现团队没有预想到的新用例,或者客户与你的解决方案的交互方式可能与你想象的不同。在任何情况下,都要确保有多方面的指标(KPI)来衡量模型性能。同时,还应制定反馈循环,以便能够了解客户对你的产品的感受,并根据需要进行调整。
构建可扩展性
AI 部署中的许多挑战可以归结为数据质量低劣、资源不足和内部团队无法协调一致。如果你拥有强大的基础设施,能够获得所有相关决策者的支持,以及完备的前期规划,那么你成功的几率就会大大增加。完成这些步骤还可以帮助你将 AI 解决方案扩展到其他业务部门,进一步证明资源投资的合理性,并为未来的 AI 项目铺平道路。