第二代Qwen大模型发布，阿里巴巴一口气开源了30个不同参数规模的模型-编程知识

第二代Qwen大模型发布，阿里巴巴一口气开源了30个不同参数规模的模型

news/2025/3/10 22:28:49/文章来源:https://blog.csdn.net/df19900725/article/details/136051040

关于Qwen-1.5系列更多信息参考DataLearnerAI原文：

重磅！第二代通义千问大模型开源，阿里巴巴一口气开源了30个不同参数规模的模型，其中Qwen1.5-72B仅次于GPT-4.www.datalearner.com/blog/1051707149237037编辑https://link.zhihu.com/?target=https%3A//www.datalearner.com/blog/1051707149237037

这里我们简单总结一下这个模型的特点，更多信息参考原文了。首先Qwen-1.5应该是原计划的Qwen2-Beta版本。在此前各个开源社区提交的信息也都是Qwen2-Beta命名。但是现在出来的Qwen-1.5与Qwen2-Beta在评测结果上是差不多的，所以这里的Qwen1.5应该就是Qwen2-Beta改名的结果。

这次阿里发布的模型应该有30个，数量非常多包含6个不同参数规模的版本，分别是5亿、18亿、40亿、70亿、140亿和720亿。相比较第一代，增加了5亿规模版本和40亿参数规模版本。

Qwen1.5模型版本	Qwen1.5模型信息卡地址
Qwen1.5-0.5B-Chat	https://www.datalearner.com/ai-models/pretrained-models/Qwen1_5-0_5B-Chat
Qwen1.5-1.8B-Chat	https://www.datalearner.com/ai-models/pretrained-models/Qwen1_5-1_8B-Chat
Qwen1.5-4B-Chat	https://www.datalearner.com/ai-models/pretrained-models/Qwen1_5-4B-Chat
Qwen1.5-7B-Chat	https://www.datalearner.com/ai-models/pretrained-models/Qwen1_5-7B-Chat
Qwen1.5-14B-Chat	https://www.datalearner.com/ai-models/pretrained-models/Qwen1_5-14B-Chat
Qwen1.5-72B-Chat	https://www.datalearner.com/ai-models/pretrained-models/Qwen1_5-72B-Chat

而这6个不同参数规模版本的模型，每一个都开源了基础预训练版本、聊天优化版本、Int4量化、Int8量化以及AWQ版本，所以相当于每一个参数规模的模型都有5个版本，因此一共发布了30个版本的模型！

Qwen1.5系列模型的特点总结如下：

有6个不同参数模型版本（0.5B, 1.8B, 4B, 7B, 14B 和 72B），最小的仅5亿参数，最大的有720亿参数；
聊天优化版本的模型相比较第一代模型有明显的进步，其中720亿参数的Qwen1.5-72B在MT-Bench得分仅次于GPT-4；
基座版本和聊天版本在多语言方面的能力得到增强，包括中英文在内，共支持12种语言（如日语、俄语、法语西班牙语等）；
所有版本模型最高支持32K的长上下文输入；
支持系统提示，可以完成Roleplay；
生态完善，发布即支持vLLM、SGLang等推理加速框架；
支持不同的量化框架；
月活1亿以下直接商用授权，月活1亿以上商用需要获取授权；

但是，需要注意的是最大的版本Qwen1.5-72B的版本，相比较第一代模型在常规的评测上提升很小：

接下来我们看几个实测例子：

结果如下：

这几个问题回答得实在是有点不太好，不过，这些问题本身也很有难度，GPT-4的回答效果也一般。

下图是一个常规的json提取，效果还可以：

关于Qwen-1.5系列更多介绍参考原文：重磅！第二代通义千问大模型开源，阿里巴巴一口气开源了30个不同参数规模的模型，其中Qwen1.5-72B仅次于GPT-4. | 数据学习者官方网站(Datalearner)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/455558.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

性能实测：分布式存储 ZBS 与集中式存储 HDS 在 Oracle 数据库场景表现如何

性能实测：分布式存储 ZBS 与集中式存储 HDS 在 Oracle 数据库场景表现如何

作者：深耕行业的 SmartX 金融团队金鑫在金融客户的基础架构环境中，HDS 是一种被广泛使用的存储解决方案。作为集中式存储的代表之一，HDS 拥有高性能、高可用性和可扩展性的企业级存储特点，适用于实时数据处理、虚拟化和灾难备份…

阅读更多...

Docker下安装GitLab

Docker下安装GitLab

极狐GitLab Docker 镜像 | 极狐GitLab 安装所需最小配置内存至少4G 系统内核至少3.10以上 uname -r 命令可以查看系统内核版本安装Docker 1.更新 yum源 yum update 2.安装依赖(如果在操作第三步的时候提示yum-config-manager 未找到命令就安装下面依赖) yum instal…

阅读更多...

杨中科 ASP.NETCORE 高级14 SignalR

杨中科 ASP.NETCORE 高级14 SignalR

1、什么是websocket、SignalR 服务器向客户端发送数据 1、需求：Web聊天;站内沟通。 2、传统HTTP：只能客户端主动发送请求 3、传统方案：长轮询（Long Polling）。缺点是？（1.客户端发送请求后&…

阅读更多...

防范恶意勒索攻击！亚信安全发布《勒索家族和勒索事件监控报告》

防范恶意勒索攻击！亚信安全发布《勒索家族和勒索事件监控报告》

本周态势快速感知本周全球共监测到勒索事件81起，事件数量有所下降，比上月降低20%。 lockbit3.0仍然是影响最严重的勒索家族；akira和incransom也是两个活动频繁的恶意家族，需要注意防范。本周alphv勒索组织窃取MBC法律专业公司…

阅读更多...

[word] word表格内容自动编号 #经验分享#微信#其他

[word] word表格内容自动编号 #经验分享#微信#其他

word表格内容自动编号在表格中的内容怎么样自动编号？我们都知道Word表格和Excel表格有所不同，Excel表格可以轻松自动编号，那么在Word表格中如何自动编号呢？ 1、选中内容后，点击段落-自动编号，选择其中一…

阅读更多...

【网络安全】URL解析器混淆攻击实现ChatGPT账户接管、Glassdoor服务器XSS

【网络安全】URL解析器混淆攻击实现ChatGPT账户接管、Glassdoor服务器XSS

文章目录通配符URL解析器混淆攻击实现ChatGPT账户接管通配符URL解析器混淆攻击实现Glassdoor服务器缓存XSS 本文不承担任何由于传播、利用本文所发布内容而造成的任何后果及法律责任。本文将基于ChatGPT及Glassdoor两个实例阐发URL解析器混淆攻击。开始本文前，…

阅读更多...

离线场景下任意文档的在线预览及原样格式翻译，不依赖其他厂商接口非侵入式一行js代码实现网站的翻译及国际化，可配置使用多种翻译语言

离线场景下任意文档的在线预览及原样格式翻译，不依赖其他厂商接口非侵入式一行js代码实现网站的翻译及国际化，可配置使用多种翻译语言

离线场景下任意文档的在线预览及原样格式翻译，不依赖其他厂商接口非侵入式一行js代码实现网站的翻译及国际化，可配置使用多种翻译语言。要实现翻译需要解决以下3个主要问题： 1）from：内容本身的语言类型是什么&#xf…

阅读更多...

代码随想录算法训练营DAY13 | 栈与队列 (3)

一、LeetCode 239 滑动窗口最大值题目链接：239.滑动窗口最大值https://leetcode.cn/problems/sliding-window-maximum/ 思路：使用单调队列，只保存窗口中可能存在的最大值，从而降低时间复杂度。 public class MyQueue{Deque<I…

阅读更多...

第七届西湖论剑·中国杭州网络安全技能大赛 AI 回声海螺 WP

第七届西湖论剑·中国杭州网络安全技能大赛 AI 回声海螺 WP

第七届西湖论剑中国杭州网络安全技能大赛-AI-回声海螺开题，提示输入密码给FLAG。这个回声海螺应该是个AI，就是复读机，应该是想办法从中骗出密码。感觉这题不像是AI，也没用啥模型，应该是WEB。或者是说类似于AI的提示…

阅读更多...

2024牛客寒假算法基础集训营1——H

2024牛客寒假算法基础集训营1——H

输入 3 4 11 1 8 1 4 1 5 1 1 4 11 5 8 1 4 1 5 1 1 4 0 2 0 0 0 3 0 4 1 输出 3 6 5 思路： 考虑二进制，有点像数位dp 本题考虑集合划分，累加最大值即可代码如下： #include<bits/stdc.h> using namespace std;void solv…

阅读更多...

读写锁ReentrantReadWriteLockStampLock详解

读写锁ReentrantReadWriteLockStampLock详解

传送门：深入理解AQS独占锁之ReentrantLock源码分析目录读写锁介绍 ReentrantReadWriteLock介绍 ReentrantReadWriteLock的使用应用场景锁降级读写锁设计思路 StampedLock介绍 StampedLock的使用演示乐观读在缓存中的应用使用场景和注意事…

阅读更多...

立足智能存取解决方案｜HEGERLS智能托盘四向车储存制动能量实现能源回收

立足智能存取解决方案｜HEGERLS智能托盘四向车储存制动能量实现能源回收

对于商业配送和工业生产的企业而言，如何能高效率、低成本进行低分拣、运输、码垛、入库，用以提升仓库空间的利用效率，是现在大多企业急需要解决的行业痛点。对此，为了解决上述痛点，近年来，物流仓储集成商、…

阅读更多...

推荐文章

最新文章