最近,随着 OpenAI 发布的以用户为中心的聊天机器人 ChatGPT 的发布,大型语言模型 (LLM) 引起了人们的关注。大模型的好坏与否,主要涉及三个方面:算法、算力和数据。算法决定了其本身的学习能力,算力则影响着算法的学习效率,数据决定了AI的训练效果。
人工智能(AI)是产业发展的核心驱动力之一,也是推动图形处理单元、物联网、云计算、区块链等新兴技术与新一代大数据融合的关键因素和工业 4.0。对人工智能从底层机制到实际应用、从基础算法到产业成果、从现状到未来趋势的多角度系统分析。尽管人工智能还存在许多问题,但毫无疑问,人工智能已成为广泛应用和领域的创新和革命性助手。
人工智能是新一轮科技革命和产业变革的重要驱动力量,近年来,我国人工智能产业在技术创新、产业生态、融合应用等方面取得积极进展,已进入全球第一梯队。大数据、大算力推动了人工智能发展走向大模型时代。AI大模型是指经过大规模数据训练且在经微调后即可适应广泛下游任务的模型。随着参数规模不断扩大,AI大模型在语言、视觉、推理、人机交互等领域不断涌现出新能力。
目前,中国和美国研发的大模型数量占全球总数的80%以上,中国大模型数量排名仅次于美国。我国前期在人工智能领域的各项部署为大模型发展奠定了坚实基础,已经建立起涵盖理论方法和软硬件技术的体系化研发能力,形成了紧跟世界前沿的大模型技术群。数据显示,截止至2023年,我国参数规模在10亿以上的大模型总数量达79个。
美国领先,AI公司投资份额53%(270亿美元),中国第二,占比10%
行业发展前景:
1.政策支持行业发展
人工智能是国家战略的重要组成部分,是未来国际竞争的焦点和经济发展的新引擎。近年来,中国人工智能行业受到各级政府的高度重视和国家产业政策的重点支持,国家陆续出台了多项政策,鼓励人工智能行业发展与创新。
今年4月,国家互联网信息办公室发布了《生成式人工智能服务管理办法(征求意见稿)》,首次明确了生成式人工智能“提供者”内容生产、数据保护、隐私安全等方面的法定责任及法律依据,确立了人工智能产品的安全评估规定及管理办法。近日,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布《生成式人工智能服务管理暂行办法》,自2023年8月15日起施行。
2.AI基础数据服务规模增长
在AI产业链中,算法、算力和数据共同构成技术发展的三大核心要素。算法模型从技术理论到应用实践的落地过程依赖于大量的训练数据。训练数据越多、越完整、质量越高,模型推断的结论越可靠。随着人工智能、区块链、IoT等新兴技术的发展,全球的基础数据服务规模都高速增长。未来智能制造、元宇宙、生成式AI等复杂智能场景的实现,将对人工智能基础数据服务提出了更高的要求。
3.算力基础设施建设加快
发展AI大模型,算力是重要支撑。加快算力基础设施建设,优化算力资源布局、提升算力应用强度至关重要。随着全国一体化算力网络国家枢纽节点的部署和“东数西算”工程的推进,我国算力基础设施建设快速发展,算力规模持续扩大。根据国家信息中心与浪潮信息联合发布的《智能计算中心创新发展指南》,目前全国有超过30个城市正在建设或提出建设智算中心,“十四五”期间,对智算中心的投资可带动人工智能核心产业增长约2.9-3.4倍。
总结:
AI技术促进了人工智能辅助各行各业的发展。然而,仍然存在挑战。目前正在进行的工作是解决多模式数据集成、平衡定量算法性能和定性模型可解释性、保护模型安全、学习和模型偏差。