全球最强即时推理AI大模型Claude 3.7发布！-编程知识

全球最强即时推理AI大模型Claude 3.7发布！

news/2025/2/25 17:33:14/文章来源:https://www.cnblogs.com/JavaEdge/p/18736837

0 前言

2025年2月25日，今天发布迄今为止最智能的模型——Claude 3.7 Sonnet，全球首个混合推理（Hybrid Reasoning）模型。

提供：

近乎实时回答
同时进行深入的、分步骤的推理
且这种思考过程可直观展示给用户
对API用户，还可精细控制模型的思考时长

在编程和前端开发方面表现尤为出色。还推出一款全新的命令行工具——Claude Code，专为智能代理式（Agentic）编码设计。目前处限量研究预览阶段，允许开发者直接在终端委托 Claude 执行复杂工程任务。

Claude Code介绍界面：

1 面向所有用户

1.1 访问入口

Claude 官网（Claude.ai），支持免费版、Pro、团队版和企业版（免费版不支持“扩展思考”模式）
API 接入：Anthropic API
云服务：Amazon Bedrock、Google Cloud Vertex AI

1.2 价格

标准模式和扩展思考模式均维持与前代相同费用：

输入：每百万 tokens $3
输出：每百万 tokens $15（包含思考过程的 tokens）

2 让最强推理更实用

采用不同市场上其他推理模型的设计理念。与人类一样，我们认为 AI 不应将快速反应与深度思考分离，而应统一到同一个模型。这种方法能带来更流畅的用户体验，并让 AI 更自然地在不同任务间切换推理方式。

2.1 Claude 3.7 Sonnet的核心特性

2.1.1 普通 LLM + 推理模型【合体】

用户可选快速回答，也可让 Claude 深度思考后再作答。

扩展思考模式下，Claude 3.7 Sonnet会进行自我反思，以提升数学、物理、代码编写、指令执行等表现。

2.1.2 API可控的思考预算

开发者可通过 API 设置 Claude 最多思考 N 个 tokens（最高可达 128K tokens），实现速度、成本和回答质量的三角平衡。

2.1.3 更贴近真实业务场景的优化

相较数学或编程竞赛问题，我们更专注企业实际使用 LLM 的需求，如代码维护、调试、自动化开发等。

早期测试中，Claude 3.7 Sonnet编程能力遥遥领先：

Cursor：Claude继续成为处理真实代码任务的最佳 AI，能处理复杂代码库并使用高级工具
Cognition：Claude 在代码修改规划和全栈开发方面远超其他模型
Vercel：Claude 在复杂自动化任务中表现极为精准
Replit：Claude 能从零构建复杂的 Web 应用和仪表盘，而其他模型常会卡住
Canva：Claude 生成的代码不仅生产就绪，而且设计风格更优，错误率显著减少

2.2 关键基准测试表现卓越

2.2.1 SWE-bench Verified

评估 AI 解决真实软件问题的能力，取得最先进的表现：

2.2.2 TAU-bench

测试 AI 在复杂任务中的用户交互和工具调用能力，依然领先：

TAU-bench

2.2.3 综合能力

在指令跟随、推理、多模态理解、代码代理等方面均表现优异，扩展思考模式在数学和科学任务中带来额外优势。前沿推理模型对比：

3 Claude Code：智能代理式编程助手

自 2024 年 6 月以来，Sonnet 已成为开发者首选模型。今天进一步推出Claude Code——Anthropic 的首款智能代理编程工具（限量研究预览）。

Claude Code 能执行代码搜索、文件编辑、测试编写和运行、GitHub 提交、命令行操作，整个过程保持透明可控。

Claude Code在内测中大幅提高开发效率：

复杂调试、重构：可高效解决复杂 bug，并进行大规模代码重构
任务自动化：完成原本需 45+ 分钟的任务，仅需一次性执行

计划在未来几周内不断

优化

提升工具调用的可靠性
支持长时间运行的命令
增强代码解析和交互能力

申请加入 Claude Code 预览，一起塑造 Claude 的未来！

4 展望

Claude 3.7 Sonnet 和 Claude Code 标志着 AI 从助手向智能伙伴进化的重要一步。它们不仅具备深度推理、自动执行任务的能力，还能高效协作，真正扩展人类的创造力。

期待看到大家用它们创造出怎样的精彩应用！🎉

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！

🚀 魔都架构师 | 全网30W+技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统亿级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新，我们的征途是改变世界！
👉 实战干货：编程严选网

本文由博客一文多发平台 OpenWrite 发布！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/889660.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！