[AI/AIGC/LLM] 通义千问QwQ-32B: 阿里巴巴开源的、最新最强开源(推理)大模型 | Apache 2.0

news/2025/3/7 1:51:43/文章来源:https://www.cnblogs.com/johnnyzen/p/18756866

序：

2025年3月6日凌晨，阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B。
通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。
在保持强劲性能的同时，千问QwQ-32B还大幅降低了部署使用成本，在消费级显卡上也能实现本地部署。
目前，阿里已采用宽松的Apache2.0协议，将千问QwQ-32B模型向全球开源，所有人都可免费下载及商用。
同时，用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。

概述：QwQ-32B

比肩DeepSeek-R1，阿里巴巴发布全新推理模型

综合表现与简介

千问QwQ-32B既能提供极强的推理能力，又能满足更低的资源消耗需求，非常适合快速响应或对数据安全要求高的应用场景，开发者和企业可以在消费级硬件上轻松将其部署到本地设备中，进一步打造高度定制化的 AI 解决方案。

此外，千问QwQ-32B模型中还集成了与智能体 Agent 相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。
阿里通义团队表示，未来将继续探索将智能体与强化学习的集成，以实现长时推理，探索更高智能进而最终实现AGI的目标。

从性能表现来看，千问QwQ-32B 模型在一系列权威基准测试中表现异常出色，几乎完全超越了OpenAI-o1-mini，比肩最强开源推理模型DeepSeek-R1：

在测试数学能力的AIME24评测集上，以及评估代码能力的LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1蒸馏模型；

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、
由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek-R1。
目前，千问QwQ-32B已在魔搭社区、HuggingFace及GitHub等平台基于宽松的Apache2.0协议开源，所有人都可免费下载模型进行本地部署，或者通过阿里云百炼平台直接调用模型API服务。

对于云端部署需求，用户可通过阿里云PAI平台完成快速部署，并进行模型微调、评测和应用搭建；
或是选择容器服务ACK搭配阿里云GPU 算力（如GPU 云服务器、容器计算服务ACS 等），实现模型容器化部署和高效推理。

是不是有一股广告味儿？确实没有收钱。。。阿里确实提供了这些服务。

实际上，自2023年以来，阿里通义团队已开源200多款模型，包含：大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列，开源囊括文本生成模型、视觉理解/生成模型、语音理解/生成模型、文生图及视频模型等“全模态”，覆盖从0.5B到110B等参数“全尺寸”，屡次斩获Chatbot Arena、司南OpenCompass等权威榜单“全球开源冠军”、“国产模型冠军”。
截至目前，海内外AI开源社区中千问Qwen的衍生模型数量突破10万，超越美国Llama系列模型，成为全球最大的【开源模型族群】。

X 参考文献

比肩DeepSeek-R1，阿里巴巴发布全新推理模型 - 中国电子报、电子信息产业网/宋婧

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/894908.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

The Vendi Score: A Diversity Evaluation Metric for Machine Learning 论文笔记

介绍我们基于生态学和量子统计力学的思想，提出了 Vendi 分数用来解决多样性评估问题 Vendi 分数不需要参考数据集或样本或标签的分布，因此它是通用的，适用于任何可以定义相似性的领域的生成模型、解码算法和数据集创新之前的多样性指标的适用性可能受到限制，因为它们需要…

MM-LLMs: Recent Advances in MultiModal Large Language Models 论文笔记

介绍这是一篇多模态大模型的综述 MM-LLM面临的核心挑战是如何有效地将LLM与其他模式的模型连接起来以实现协作推理建立了一个网站（https://mm-llms.github.io）来跟踪MM-LLM的最新进展并方便大家更新模型架构冻结部分不可训练，未冻结部分是可训练的Modality Encoder：对不…

Root cause detection in a service-oriented architecture 论文笔记

背景 MonitorRank 是最早使用随机游走的策略定位故障根因服务的方法，MonitorRank 把系统的服务分成三类：前端服务：负责接收用户的请求以及进一步调用下游请求以完成用户的请求。应用服务：负责真正处理用户请求的逻辑。数据服务：负责提供经过包装的数据。（应用服务和数据…

MicroRank 论文笔记

任务异常检测->根因定位（服务实例级别）（针对延迟问题）贡献MicroRank 是第一种通过正常和异常trace提取信息来对微服务应用程序进行根本原因定位的方法我们提出了一种基于扩展频谱分析的微服务环境中新颖的根本原因定位方法我们将 OpenTelemetry trace API 纳入 Goog…

Log3T 论文笔记

挑战 ① 基于可用日志先验知识设计的日志解析器性能有限，且不具有泛化性 ② 一些日志解析器在日志本身差异性大时无法正常工作 ③ 劳动密集型模型调整框架离线训练使用 WordPiece 进行 Tokenization（子词模型），然后输入到 Transformer 中进行上下文特征集成，然后输入 si…

这个作业属于哪个课程 https://edu.cnblogs.com/campus/gdgy/SoftwareEngineeringClassof2023这个作业在哪里 https://edu.cnblogs.com/campus/gdgy/SoftwareEngineeringClassof2023/homework/13324这个作业的目标系统化流程地完成软件开发，使用性能测试工具和单元测试以优化…

LLaVA 论文笔记

介绍提出了 visual instruction-tuning，这是将指令微调扩展到多模态的首次尝试相关工作多模态的指令微调 Agent、指令微调数据使用 ChatGPT/GPT-4 来将数据转化为 multimodel instrustion-following data 为每一个图像生成三种 mulmodal instruction-following data，对于…

FastAPI 请求体参数与 Pydantic 模型完全指南：从基础到嵌套模型实战

title: FastAPI 请求体参数与 Pydantic 模型完全指南：从基础到嵌套模型实战 🚀 date: 2025/3/7 updated: 2025/3/7 author: cmdragon excerpt: 本教程深入探讨 FastAPI 请求体参数与 Pydantic 模型的核心机制，涵盖从基础模型定义到嵌套模型的高级用法。通过详细的代码示例…

主机、主机中的Ubuntu虚拟机、与ixm6ull开发板三者互ping且均能联网个人流程记录

1.0 设备连接要求笔记本通过网线连接到开发板，且笔记本通过 usb转type-c线连接到开发板的对应位置（USB TTL那个）。笔记本需要连接WIFI。笔记本、开发板、Ubuntu虚拟机启动且能够正常运行。2.0 打开WIFI的网络共享控制面板 -> 网络和 Internet -> 网络和共享中心，选…