开源王者!全球最强的开源大模型Llama3发布!15万亿数据集训练,最高4000亿参数,数学评测超过GPT-4,全球第二!

本文原文来自DataLearnerAI官方网站:

开源王者!全球最强的开源大模型Llama3发布!15万亿数据集训练,最高4000亿参数,数学评测超过GPT-4,全球第二! | 数据学习者官方网站(Datalearner)icon-default.png?t=N7T8https://www.datalearner.com/blog/1051713454866102

大语言模型开源领域最重要的一个模型就是MetaAI开源的Llama系列。当前,很多著名开源模型都是基于Llama系列进行预训练得到。就在刚才,MetaAI开源了第三代Llama3系列。官方透露的信息非常多,Llama3系列是目前为止最强的开源大语言模型,未来还有4000亿参数版本,支持多模态、超长上下文、多国语言!

  • Llama3系列简介
  • Llama3-70B是目前最强的开源大模型
  • Llama3的人工评分
  • Llama3最大的版本是4000亿参数规模
  • Llama3开源情况
Llama3系列简介

Llama3系列模型是MetaAI开源的第三代大语言模型,本次发布的包含2个不同参数规模的版本,一个是80亿参数的LLama3-8B,另一个是700亿参数规模的Llama3-70B。

不过,根据官方描述,目前这两个版本是早期预览版本,未来几个月,Llama3的能力将拓展到多语言支持和更长的上下文,并且会开源更多不同参数规模版本的模型。并且,Llama3将会有多模态版本的模型!

Llama3模型是在15万亿tokens数据集上训练,是Llama2的7倍!其中的代码数据集高4倍!当前支持的上下文长度是128K!

Llama3模型具体信息可以参考DataLearnerAI模型信息卡:

Llama3版本名称DataLearnerAI模型信息卡
Llama3-8BLlama3-8B(Llama3-8B)详细信息 | 名称、简介、使用方法,开源情况,商用授权信息 | 数据学习(DataLearner)
Llama3-70BLlama3-70B(Llama3-70B)详细信息 | 名称、简介、使用方法,开源情况,商用授权信息 | 数据学习(DataLearner)
Llama3-8B-InstructLlama3-8B-Instruct(Llama3-8B-Instruct)详细信息 | 名称、简介、使用方法,开源情况,商用授权信息 | 数据学习(DataLearner)
Llama3-70B-InstructLlama3-70B-Instruct(Llama3-70B-Instruct)详细信息 | 名称、简介、使用方法,开源情况,商用授权信息 | 数据学习(DataLearner)
Llama3-400Bhttps://www.datalearner.com/ai-models/pretrained-models/Llama3-400B
Llama3-400B-Instructhttps://www.datalearner.com/ai-models/pretrained-models/Llama3-400B-Instruct

需要注意的是,这里的4000亿参数版本正在训练中,还没完成。

Llama3-70B是目前最强的开源大模型

虽然目前MetaAI仅仅开源了2个不同参数规模版本的模型,其中700亿参数规模的模型评测结果极其优秀。最大的亮点是数学评测GSM8K的结果上得分93分!根据DataLearnerAI目前收集的数据,这个分数仅次于Claude3-Opus的95分,超过GPT-4,全球第二,是目前开源大模型中得分最高的一个

Llama3-70B模型评测结果

数据来源:大模型综合评测对比 | 当前主流大模型在各评测数据集上的表现总榜单 | 数据学习 (DataLearner)

可以看到,按照GSM8K排序的靠前的模型中,除了Llama3-70B外,全部是闭源的私有模型。而数学能力与推理等强相关,在解决复杂任务方面有着非常好的优势。而Llama3-70B的MMLU得分82.0分,排名在Claude3-Opus、GPT-4和Gemini Ultra之后,全球第四,成绩也是非常好,也是开源模型中最强的一个。

注意,上述模型的评测的是Llama3的指令优化版本,基座预训练得分目前只公布了MMLU部分,稍低于这些分数。

Llama3最大的版本是4000亿参数规模

MetaAI官方宣布,Llama3有很多版本,其中最大的版本是4000亿参数规模!但是这个版本的模型还在训练中!官方没有明确说未来这个版本是否开源,但是也没有否认。

但是官方依然给了一个截图,展示了还在训练中的4000亿参数版本的模型的效果:

其中MMLU得分86.1分,GSM8K得分94.1分,这意味着一旦该模型训练完成,与当前市场上公开的所有模型相比,Llama3-400B模型的评测结果一定是全球第一!它现在的版本MMLU与最高分差0.7分,GSM8K差0.4分,差距非常小!代码评测结果与第一名差距也非常小!

具体数据参考DataLearnerAI大模型评测排行榜:

数据来源:大模型综合评测对比 | 当前主流大模型在各评测数据集上的表现总榜单 | 数据学习 (DataLearner)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/637568.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用Python比较两张人脸图像并获得准确度

使用 Python、OpenCV 和人脸识别模块比较两张图像并获得这些图像之间的准确度水平。 一、原理 使用Face Recognition python 模块来获取两张图像的128 个面部编码,并比较这些编码。比较结果返回 True 或 False。如果结果为True ,那么两个图像将是相同的…

2024团体程序设计天梯赛L1-104 九宫格

题目链接L1-104 九宫格 #include<iostream> #include<stdio.h> #include<string.h> #include<algorithm> using namespace std; int n, mapp[10][10], a[10]; int dx[10]{0, 1, 1, 1, 4, 4, 4, 7, 7, 7}; int dy[10]{0, 1, 4, 7, 1, 4, 7, 1, 4, 7}; b…

2、关于数据库事务那些事

目录 1、什么是事务&#xff1f; 2、介绍下数据库事务&#xff1f; 3、并发事务会带来什么问题&#xff1f; 3.1、不可重复读和幻读有什么区别&#xff1f; 4、数据库隔离级别有哪几种&#xff1f; 5、MySQL默认使用隔离级别是啥&#xff1f; 6、如何控制并发事务&#…

山东大学操作系统实验一(Linux虚拟机实现)

目录 实验题目 实验要求 示例程序 主程序 头文件 重点代码解析 一、main函数的参数 参数介绍 参数输入方式 本块代码 二、信号处理 本块代码 原理介绍 实现效果 三、kill函数 功能介绍 使用方式 本块代码 四、头文件处理 本块代码 代码作用 实验程序 …

2024团体程序设计天梯赛L1-103 整数的持续性

题目链接L1-103 整数的持续性 #include<iostream> #include<stdio.h> #include<algorithm> using namespace std; struct node{int x;int d; }p[2000]; bool cmp(node a, node b) {if (a.d b.d) return a.x < b.x;return a.d>b.d; } int cnt, cntt; v…

日期相关的题目

日期相关的题目 1. 计算日期到天数转换2. 日期累加3. 打印日期4. 日期差值 1. 计算日期到天数转换 输出示例: 思路&#xff1a;计算前n-1个月的天数在加上这个月的天数。 #include <iostream> using namespace std;int main() {int year, month, day;cin >> yea…

自学注解----

MainApplication.java SpringBootApplication类就是—主程序类&#xff0c;告诉你这是一个SpringBoot应用 SpringBootConfiguration—就是Configuration&#xff0c;当前一个配置类 EnableAutoConfiguration— AutoConfigurationPackage自动配置包&#xff0c;包含Import导入包…

【ML】用遗传规划进行因子挖掘

【ML】用遗传规划进行因子挖掘 原创 Yud. 2AMquant 2024-04-02 07:30 广东 本文使用deap pkg进行基于遗传算法的因子挖掘。并对代码进行部分修改。 自定义了多个算子如下&#xff0c;同样包括时间序列相关的算子&#xff1a; winsorize(x) kurtdev(df,window) if_then_els…

信号----硬件中断

硬件中断 键盘组合键是向进程发送信号&#xff0c;那么键盘数据是如何输入到内核中&#xff0c;然后变成信号的&#xff1f;这个信号又是由谁发送给进程的&#xff1f; 当键盘被按下&#xff0c;操作系统先知道用户用键盘输入了内容 那么操作系统是如何知道键盘上有内容了&…

模电期末复习(五)集成运算放大电路

集成运算放大电路 5.1 集成放大电路的特点5.2 集成运放的主要技术指标5.3 集成运放的基本组成部分5.3.1 偏置电路5.3.2 差分放大输入级5.3.3 中间级5.3.4 输出级 5.4 集成运放的典型电路5.4.1 双极型集成运放LM741 5.5 各类集成运放的性能特点5.6 集成运放使用中的几个具体问题…

【Linux驱动层】iTOP-RK3568学习之路(三):字符设备驱动框架

一、总体框架图 二、字符设备相关函数 静态申请设备号 register_chrdev_region 函数原型&#xff1a;register_chrdev_region(dev_t from, unsigned count, const char *name) 函数作用&#xff1a;静态申请设备号&#xff0c;可以一次性申请多个连续的号&#xff0c;count指定…

自学网络安全,一般人我劝你还是算了吧

学前寄语&#xff1a;走进网络安全的世界 持之以恒的追求&#xff1a;网络安全不是一朝一夕的学问&#xff0c;对于那些只有三分钟热度的朋友&#xff0c;可能需要重新考虑自己的选择。网络安全需要长期的投入和热情。 独立思考与实践&#xff1a;学习网络安全&#xff0c;光看…