AI“源神”启动!Llama 3发布,开闭源之争战局生变

在AI的世界里,开源与闭源的较量一直是科技界的热门话题。

今年年初,埃隆·马斯克在对OpenAI及其CEO萨姆·奥特曼提起诉讼时,就对OpenAI逐渐不公开其模型研究相关细节的行为大加谴责。“时至今日,OpenAI公司网站还宣称,它的宗旨是确保通用人工智能造福全人类。然而,在现实中,OpenAI已经转变为科技巨头微软事实上的闭源子公司。“这位曾经的OpenAI联合创始人如此表示。

OpenAI不够“Open”,Meta却“Open”了自己最新的开源人工智能模型。

最近,Meta的一记重拳——Llama 3的发布,无疑在这场旷日持久的辩论中投下了一枚重磅炸弹。

Llama 3:开源大模型的新标杆

Meta在4月18日,也就是AI开源倡导者吴恩达的生日当天,发布了其最新版本的开源大模型Llama 3。这一举措不仅引起了开源AI社区的热烈讨论,更在资本市场上引起了波澜,Meta股价逆势收涨1.54%。次日,百度智能云千帆大模型平台开放邀约测试,提供针对Llama 3的训练推理方案,帮助开发者训练专属大模型。

更多关于Llama3的信息请查看如下文章:

  • llama3 史上最强开源大模型,赶超GTP-4,逼供OpenAI
  • LLaMA 羊驼系大语言模型的前世今生

开源与闭源:AI时代的路线之争

行至2024,开闭源之争日渐白热化。闭源阵营以目前最强的OpenAI为代表,开源阵营Meta的LLaMa、Mistral和Google等也在不断迭代。闭源阵营坚持对Scaling Law的信仰,押注在更强通用模型的打造上;开源阵营模型能力不断提升,并且强调以更垂直的性能、更灵活的配置来推动大模型商业化落地。

关于应该选择模型开源还是闭源讨论经久不息。

事实上,在Llama3发布之前,中文互联网刚刚经历了一轮开闭源论战。

据媒体报道,百度CEO李彦宏近日表态,认为大模型开源意义不大,闭源模型性能会不断提升。“有了文心大模型4.0,我们可以根据需要兼顾效果、响应速度、推理成本等各种考虑,裁剪出适合各种场景的更小尺寸模型,且支持精调和post pretrain。通过降维裁剪出的模型,比直接拿开源调出来的模型,同等尺寸下效果更好,同等效果下成本明显更低。”

李彦宏一直是闭源路线的忠实拥趸,理由包括但不限于认可闭源商业模式可以更好地聚集人力和财力等。而其反对者——360创始人周鸿祎言简意赅,“一句话,今天没有开源就没有 Linux,没有 Linux 就没有互联网。”

不下桌牌,各显神通

放眼AI界,两条路径上都各有“头号玩家”分布。闭源自不必说,海外有OpenAI旗下的ChatGPT,国内是百度的文心一言以及风头正劲的月之暗面Kimi。

而开源方面,除了Llama系列,目前应用较广的开源大模型还包括非营利组织LAION推出的OpenFlamingo、Databricks的Dolly,以及MosaicML的MPT等。国内则包括,阿里巴巴的通义千问,智谱的ChatGLM-4、百川智能的baichuan-7B中英文大模型、北京智源悟道3.0大模型系列和面壁智能的CPM-Bee 10B中文基座大模型等。

形成这样的分化,很多时候是受技术进步和商业模式迭代等的多重影响。

从技术角度来看,开源可以促进学术界的研究和创新,而闭源则有助于在一定时间内保持技术领先优势。

从商业角度来看,开源可以吸引开发者社区的贡献,促进技术的快速迭代和应用的广泛传播,但可能会影响到公司的盈利模式。闭源则可以保护知识产权,为公司创造直接的收入来源,但可能会限制技术的普及和生态的建设。

结语

Llama 3的发布,不仅是技术上的一次飞跃,也是开源与闭源之争中的一个关键节点。随着AI技术的不断进步,这一辩论可能会持续下去,而市场和用户的选择将最终决定哪种模式能够占据主导地位。

开源与闭源大模型之间不太可能分出绝对的输赢,因为它们各自适合不同的应用和场景。开源大模型更适合那些需要快速创新和大规模协作的项目,而闭源大模型可能更适合那些对性能和安全性有极高要求的商业应用。


欢迎关注微信公众号:大数据AI

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/702699.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

哪个牌子的超声波清洗机好?四大质量出众超声波清洗机汇众

由于科技的进步,超声波清洗机已经成为了家庭和专业场所不可或缺的高效清洁工具。它利用超声波波动产生的微小气泡来清洁物品表面及细缝中的污渍,实现深层次的清洁效果。特别是对于眼镜这样的精密物品,定期进行深度清洁不仅能够确保视觉的清晰…

2024年软考模拟练习平台(保姆级教程分享)

2024年上半年机考模拟系统已经开放,2024年上半年的考生请注意: 1.面向对象:参加2024年上半年计算机软件资格考试的考生 2.机考模拟时间:2024年5月13日9:00至5月23日17:00 注意:模拟作答系统是计算机技术…

new delete用法它们与 malloc free 的区别

文章目录 new 和 delete的用法operate new() operate delete() new delete 和 malloc free的区别new[] delete[] 的含义 new 和 delete的用法 基本写法,new也是先申请空间 这里的new和malloc用的地方一样但是new用起来代码简洁不少而且不需要强转和指定大小 int m…

“Linux”目录结构and配置网络

了解完命令格式和vi、vim编辑器后,我们来认识一下目录的结构: 一、目录 (1)目录的特点 windows特点: Windows中有C、D、E盘,每个都是一个根系统 Linux特点: linux中只有一个根(单…

研究变压器感应耐压试验电源的能效和节能潜力

变压器感应耐压试验电源 变压器感应耐压试验电源在电源行业中是一种非常重要的设备,用于测试和验证变压器的绝缘性能。变压器感应耐压试验电源是一种专门为变压器感应耐压试验而设计的电源设备。它的工作原理基于变压器的感应原理,利用感应电压来对变压器…

打开指定文件夹下的jupyter

cd到相应路径,输入jupyter notebook ./ 注意./ 非常重要,不然又进了默认文件夹

Pytorch深度学习入门--1.Tensor基础

一、Tensor Tensor,中文叫做张量,它是Pytorch中最基本的数据类型,同时也是最重要的数据类型 二、数学含义 在数学中,标量是只有大小没有方向的量。例如,1,2,3等。向量是既有大小又有方向的量。例如, &am…

【案例】使用Vue实现拖拽课表

效果展示 效果说明 点击左侧的课程并进行拖拽,拖拽到要开设本课程的地方然后松手,即可将本节课设置为当前所拖拽的科目并且背景色为当前科目的背景色,当多次拖拽到同一节课的时候将会实现后者覆盖前者的效果。 效果实现代码 第一步&#x…

Linux 通过关键字查找文件

按文件名查找 find 路径 -name “文件名” 查找当前目录下的所有mk文件 find . -name "*.mk"按关键字查找 find 路径 -name “文件名” | xargs grep -n “关键字” 参数: xargs 是给命令传递参数的一个过滤器,也是组合多个命令的一个工具 -n…

使用 Python 进行图像验证码识别训练及调用

目录 1、验证码识别原理1.1 Tensorflow 介绍1.2 Tensorflow 运行原理1.3 卷积神经网络 CNN(Convolutional Neural Networks) 2、验证码识别实现步骤2.1 安装第三方模块2.1.1 安装 TensorFlow 模块2.2.2 安装 cuda2.2.3 下载 cudnn 2.2 读取验证码样本形成…

重磅!麒麟信安发布CentOS安全加固套件

CentOS Linux 7系统即将在6月30日停服,标志CentOS全部停止更新和维护。党政、金融、能源、通信、交通、公共服务等关键信息基础设施领域已经投运使用的CentOS系统将无法获取官方提供的漏洞修复补丁,此后,CentOS系统将面临巨大的安全风险与危害…

【Kubenetes】微服务治理:服务网格Istio安装搭建体验

文章目录 ServiceMesh介绍Istio解决方案安装Istio第一步 下载istio第二步 安装istio环境第三部 安装istio应用第四部 暴露到外部流量然后再下一步 把dashboard弄好 ServiceMesh介绍 扯淡环节 什么是服务网格?–服务间通信,可扩展性和灵活性服务网格的工作原理 --…