https://www.msn.cn/zh-cn/news/other/ibm%E9%A6%96%E5%B8%AD%E6%89%A7%E8%A1%8C%E5%AE%98-deepseek%E8%AF%81%E6%98%8E%E6%88%91%E4%BB%AC%E6%98%AF%E5%AF%B9%E7%9A%84/ar-AA1yt9cM?ocid=msedgdhp&pc=CNNDDB&cvid=67a55b58d11a4bb4870ce8fcc6ee77f1&ei=28
原文:
......
DeepSeek对AI领域的启示
构建这样一个未来的关键在于小型开源模型。DeepSeek给我们带来的启示是,最佳的工程设计应该从性能和成本两个方面进行优化。一直以来,AI被视为规模化的游戏——模型规模越大,效果越好。但DeepSeek真正的突破除了规模,还关乎效率方面。在IBM的研究中,我们发现针对特定用途优化的模型已经将AI推理成本降低了30倍,极大提高了AI模型训练的效率和可及性。
我不认为通用人工智能(AGI)即将到来,或者AI的未来取决于建造规模如曼哈顿般庞大、依靠核能供电的数据中心。这些观点制造了虚假的二元对立。没有任何物理法则规定AI必须是昂贵的。训练和推理成本并不是固定的——这是一个亟待解决的工程挑战。无论老牌企业还是初创公司都有能力降低这些成本,使AI变得更实用和更加普及。
这种情况早有先例。在计算机发展初期,存储和处理能力成本高昂,令人望而却步。然而,通过技术进步和规模经济效应,这些成本大幅下降,由此开启了一波又一波的创新和应用浪潮。
......