新火种AI|正面硬刚OpenAI与谷歌?微软竟然偷偷自研出5000亿参数大模型!

在AI领域,微软公司一直以其独到的创新性和前瞻性而闻名。也正因此,它抢先在AI赛道嗅到商机,并极具预判性的投资了OpenAI,使其成为自己在AI赛道上的最强助力。不过,微软的野心不止于此。

根据The Information 5月6日的报道,微软公司即将推出一款全新的AI模型产品,内部代号为MAI-1,其参数数量达到了惊人的5000亿。值得一提的是,这款大模型产品由微软独自研发推出。换句话说,微软正式开始了与一众行业巨头的竞争,这其中也包括OpenAI。

微软的独自AI之路,从MAI-1开始...

就在不到一个月前,微软刚推出了一款名为Phi-3的小型AI模型,其中Phi-3 mini被优化至可部署在手机上,拥有38亿参数,经过3.3万亿token的训练,微软称其性能与GPT-3.5等模型相当。

相比之下,MAI-1的规模要大得多,也需要更多的算力投入和训练数据

MAI-1的出现具有极其重要的意义,它标志着微软在AI领域迈进了一大步,并且开始执行与谷歌和OpenAI等公司竞争的战略举措。

MAI-1的开发由前谷歌AI领导人,Inflection前首席执行官Mustafa Suleyman领导。选择一个“外人”来领导项目,这表明微软正在努力扩大其AI能力,减少对外部合作伙伴,特别是对OpenAI的依赖。

MAI-1具备庞大的参数数量,拥有约5000亿个参数,远超微软此前训练的任何一个开源模型。这个参数规模意味着MAI-1能够处理极其复杂的任务,并且很有可能在性能上与谷歌的Gemini 1.5,Anthropic的Claude 3以及OpenAI的GPT-4等知名大模型相匹敌。为了支持MAI-1的开发,微软已经配置了大量包含英伟达GPU在内的服务器集群,并从各类来源收集训练数据。

不过,也有人对MAI-1的原创性产生了怀疑。就在今年3月,微软刚刚领投完Infection的最新一轮融资。在此之后,微软便从Infection挖走了包括Mustafa Suleyman在内的两位联合创始人以及部分员工。有知情人士透露,微软为此向Infection支付了超过6.5亿美元。所以,很多人合理怀疑,MAI-1与Inflection的技术高度相似。对此,有微软员工表示,尽管MAI-1可能借鉴了Inflection旗下模型的部分技术,但可以肯定的是,MAI-1是一款全新的大语言模型,远超微软此前训练的任何开源模型

先前推出的Phi系列模型和最近的MAI-1研发体现出微软要在AI领域采取双重策略的意图:一边为移动设备开发小型本地模型,一边开发由云端支持的更大规模的模型

亦敌亦友!微软与OpenAI之间的竞争将日益加深。

作为OpenAI背后的大金主,微软曾经为其提供过不遗余力的支持。不过,商场如战场,为了自身利益,今天的亲密伙伴很可能变成明天的对手。想要独立发展AI赛道,这几乎成为了微软的必经之路。

一方面,作为科技大厂,微软急需在AI领域获取技术方面的独立性,这就需要不断减少对外部合作伙伴,尤其是对OpenAI的依赖。也只有这样,才能在AI领域拥有更多的自主权和技术控制力。

另一方面,微软进驻AI赛道进行角力,势必是奔着头部的位置去的,也势必对AI行业的战略布局与市场主导地位抱有追求。自研出MAI-1,使得微软能够在大型语言模型领域获取优势,与其他包括谷歌,OpenAI在内的科技巨头形成了平起平坐的竞争关系。

更重要的是,微软早已开始进行投资与资源积累,如今的MAI-1正是水到渠成的结果。譬如早早进行规划,大量囤积AI芯片;未来几年将在GPU和数据中心上进行巨额投资等,都说明微软在AI领域的布局和努力是长线的,基于这些准备,微软做出MAI-1也就成了情理之中的事情。

那么,MAI的出现会成为微软与OpenAI分道扬镳,乃至撕破脸决裂的关键节点吗?倒也未必。

首先,二者的产品存在着明显的差异化。所以,微软想做的,很可能是通过MAI-1提供与OpenAI不同的功能或服务,以此来吸引更多的用户和市场。

此外,从某种程度上说,微软大力研发MAI的行为是对内部争议的回应。根据微软内部人士透露,公司中的一些领导对于原先的AI战略表示不满,认为其过于关注与OpenAI的合作关系,导致对AI原创研究的预算减少。MAI-1的开发可能是对这种内部不满的回应,并且成为了推动公司内部创新和研发的动力。

当前人工智能行业竞争日趋激烈,马上就要成为名副其实的红海。微软此时推出MAI-1,恰恰是对行业竞争态势进行响应,并展现出自己积极入局的决心。因为MAI-1并不是一个单纯的AI大模型,微软推出它,所追求的深层原因有很多,包括追求技术独立性,增强市场竞争力,长期投资与资源积累,产品差异,内部研发动力,战略转移等等。

如今,尽管MA-1的具体应用和性能还有待评估,但毫无疑问,它将成为AI领域的重要竞争者。也正是因为横空出世的MAI-1,我们可以清晰的感知到AI赛道的竞争之激烈,看到了科技巨头之间的激烈厮杀和战略操纵。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/688283.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

导电滑环质量如何评估

一. 外观尺寸检测 1. 外观检查 外观检测是导电滑环的基本检测内容之一,包括检查导电滑环是否存在表面损伤、划痕、变形等问题。在外观检测中,还需要关注滑环表面是否平整光洁,导电环和滑动环之间的安装是否牢固,是否有脱落和变形…

flowable多对并发网关跳转的分析

更多ruoyi-nbcio功能请看演示系统 gitee源代码地址 前后端代码: https://gitee.com/nbacheng/ruoyi-nbcio 演示地址:RuoYi-Nbcio后台管理系统 http://218.75.87.38:9666/ 更多nbcio-boot功能请看演示系统 gitee源代码地址 后端代码: h…

网络流 24 题」数字梯形 【费用流、拆点】

网络流 24 题」数字梯形 思路 对于规则 1 1 1,要求的是点不相交且边不相交,我们可以把边的容量设置成 1 1 1,把点拆分成入点和出点,将其内部的容量设置成 1 1 1,这样就可以限制点的流量。 把相应的点之间的边的费用…

C++基础中的存储类别

存储的类别是变量的属性之一,C语言定义了4种变量的存储类别,分别是auto变量、static变量、register变量和extern变量。以下重点介绍这几种类型。 一、auto变量 auto变量是C默认的存储类型。函数内未加存储类型说明的变量均被称为自动变量,即…

【CTFHub】HTTP 请求方式 302跳转 cookie WP

1.请求方式 打开给出的URL进入一个页面,提示原方法是GET,用CTFHUB方法就能获得flag 思路:抓包,将GET方法改成CTFHUB方法进行重新发送请求,查看响应情况 1.打开代理服务器 2.打开BurpSuite 刷新页面获得拦截 3.发送…

东南亚服务器租用托管的优势

东南亚地区在国际贸易领域展现出了巨大的潜力和吸引力,其未来的外贸发展前景被认为是广阔且充满了无限商机。这一地区以其人口众多、经济快速发展的特点,结合独特的地理优势和丰富的自然资源,正在吸引全球企业的目光。今天我们一起来看看东南…

matlab 基于拉依达检验法(3σ准则) 实现多类别多参数的批量异常样本检验 V2.0

简介 拉依达检验法(3σ准则)是一种统计学方法,用于检测数据中的异常值。这种方法基于正态分布的特性来确定数据点是否可能是异常值。以下是关于拉依达检验法(3σ准则)的详细介绍: 基本原理: 拉…

uni-app安卓本地打包个推图标配置

如果什么都不配置,默认的就是个推小鲸鱼图标 默认效果 配置成功效果 个推图标配置 新建目录 drawable-hdpi、drawable-ldpi、drawable-mdpi、drawable-xhdpi、drawable-xxhdpi、drawable-xxxhdpi 目录中存放图标 每个目录中存放对应大小的图标,大图…

谁使用DITA?

▲ 搜索“大龙谈智能内容”关注公众号▲ Keith根据LinkedIn上的数据进行的统计,主要反应的西方世界使用DITA的公司。因为LinkedIn在国内不能访问,笔者认为针对中国的数据并不准确。 作者 | John Walker - NXP销售和市场营销业务分析师 2013年4月18日 …

5.9网络协议

由网卡发送数据通过网线进行发送,当网卡接收到信号以后将数据传给内核数据区,然后由操作系统交给相应的进程。 将数据进行发送的时候需要借助于网线实现,这个时候会出现当传输的数据比较远的时候就借助于中继器将信号进行再生扩大&#xff0…

代码质量检查jacoco环境搭建

这里主要介绍集成和系统测试覆盖率环境搭建,并简单介绍各个工具。 关于单元测试的覆盖率监控(只需要修改ant或maven配置即可),下一篇说明 环境准备 需要环境 jdk1.8centos 7posgresql 9.6 工具下载 jacoco 0.8.2 https://www.eclemma.org/jacoco/ a…

一个“彩光”的自白:入室10万间的变革路

从0到10W 锐捷以太彩光的每一步 2021年 以太全光奠基 锐捷网络创新性提出了以太全光路线的代表性方案——极简以太全光解决方案1.0,在采用光纤作为传播介质的基础上,将交换机直接下沉至房间内。这一举措不仅简化了布线,新增业务只需在房间内灵活扩展,即可完成终端入网,而且通…