全球最强即时推理AI大模型Claude 3.7发布!

news/2025/2/25 17:33:14/文章来源:https://www.cnblogs.com/JavaEdge/p/18736837

0 前言

2025年2月25日,今天发布迄今为止最智能的模型——Claude 3.7 Sonnet,全球首个混合推理(Hybrid Reasoning)模型。

提供:

  • 近乎实时回答
  • 同时进行深入的、分步骤的推理
  • 且这种思考过程可直观展示给用户
  • 对API用户,还可精细控制模型的思考时长

编程和前端开发方面表现尤为出色。还推出一款全新的命令行工具——Claude Code,专为智能代理式(Agentic)编码设计。目前处限量研究预览阶段,允许开发者直接在终端委托 Claude 执行复杂工程任务

Claude Code介绍界面:

1 面向所有用户

1.1 访问入口

  • Claude 官网(Claude.ai),支持免费版、Pro、团队版和企业版(免费版不支持“扩展思考”模式)
  • API 接入:Anthropic API
  • 云服务:Amazon Bedrock、Google Cloud Vertex AI

1.2 价格

标准模式和扩展思考模式均维持与前代相同费用:

  • 输入:每百万 tokens $3
  • 输出:每百万 tokens $15(包含思考过程的 tokens)

2 让最强推理更实用

采用不同市场上其他推理模型的设计理念。与人类一样,我们认为 AI 不应将快速反应与深度思考分离,而应统一到同一个模型。这种方法能带来更流畅的用户体验,并让 AI 更自然地在不同任务间切换推理方式

2.1 Claude 3.7 Sonnet的核心特性

2.1.1 普通 LLM + 推理模型【合体】

用户可选快速回答,也可让 Claude 深度思考后再作答。

扩展思考模式下,Claude 3.7 Sonnet会进行自我反思,以提升数学、物理、代码编写、指令执行等表现。

2.1.2 API可控的思考预算

开发者可通过 API 设置 Claude 最多思考 N 个 tokens(最高可达 128K tokens),实现速度、成本和回答质量的三角平衡。

2.1.3 更贴近真实业务场景的优化

相较数学或编程竞赛问题,我们更专注企业实际使用 LLM 的需求,如代码维护、调试、自动化开发等。

早期测试中,Claude 3.7 Sonnet编程能力遥遥领先:

  • Cursor:Claude继续成为处理真实代码任务最佳 AI,能处理复杂代码库并使用高级工具
  • Cognition:Claude 在代码修改规划全栈开发方面远超其他模型
  • Vercel:Claude 在复杂自动化任务中表现极为精准
  • Replit:Claude 能从零构建复杂的 Web 应用和仪表盘,而其他模型常会卡住
  • Canva:Claude 生成的代码不仅生产就绪,而且设计风格更优,错误率显著减少

2.2 关键基准测试表现卓越

2.2.1 SWE-bench Verified

评估 AI 解决真实软件问题的能力,取得最先进的表现:

2.2.2 TAU-bench

测试 AI 在复杂任务中的用户交互和工具调用能力,依然领先:

TAU-bench

2.2.3 综合能力

指令跟随、推理、多模态理解、代码代理等方面均表现优异,扩展思考模式在数学和科学任务中带来额外优势。前沿推理模型对比:

3 Claude Code:智能代理式编程助手

自 2024 年 6 月以来,Sonnet 已成为开发者首选模型。今天进一步推出Claude Code——Anthropic 的首款智能代理编程工具(限量研究预览)。

Claude Code 能执行代码搜索、文件编辑、测试编写和运行、GitHub 提交、命令行操作,整个过程保持透明可控

Claude Code在内测中大幅提高开发效率

  • 复杂调试、重构:可高效解决复杂 bug,并进行大规模代码重构
  • 任务自动化:完成原本需 45+ 分钟的任务,仅需一次性执行

计划在未来几周内不断

优化

  • 提升工具调用的可靠性
  • 支持长时间运行的命令
  • 增强代码解析和交互能力

申请加入 Claude Code 预览,一起塑造 Claude 的未来!

4 展望

Claude 3.7 Sonnet 和 Claude Code 标志着 AI 从助手向智能伙伴进化的重要一步。它们不仅具备深度推理、自动执行任务的能力,还能高效协作,真正扩展人类的创造力。

期待看到大家用它们创造出怎样的精彩应用!🎉

本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!

  • 🚀 魔都架构师 | 全网30W+技术追随者
  • 🔧 大厂分布式系统/数据中台实战专家
  • 🏆 主导交易系统亿级流量调优 & 车联网平台架构
  • 🧠 AIGC应用开发先行者 | 区块链落地实践者
  • 🌍 以技术驱动创新,我们的征途是改变世界!
  • 👉 实战干货:编程严选网

本文由博客一文多发平台 OpenWrite 发布!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/889660.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

S2-邪恶-死亡骑士DK-团体-大秘境-专精-天赋-配装-宏

S2毕业装--属性 急速>精通>爆击>全能 急速和精通越高越好。爆击随缘。不要全能。 --团本/单体天赋(更新时间2月8日)--团本/单体天赋代码 CwPAAAAAAAAAAAAAAAAAAAAAAAAzMjZMGDzYmZmphZmZGzYAAAAAAAAAMzMzwYwMAgZzMMbzYmZmxMDwiZxwADMbM0YBAmBA --大秘/AOE天启骑士天赋(…

实现3D地图 并且显示地图动态跳动标识,鼠标滑过标识 显示此标识下的详细信息,红色为异常标识,悬浮框内显示查看详情信息

<template><div><divclass="container"style="height: 650px; width: 100%"ref="mapContainer"v-loading="loading"element-loading-background="rgba(0, 0, 0, 0.6)"element-loading-text="拼命加载中…

S2-痛苦-术士Warlock-团体-大秘境-专精-天赋-配装-宏

S2毕业装--属性 精通>急速>爆击>全能 精通和急速越高越好。爆击随缘。不要全能。 --团本/单体天赋(更新时间2月10日)--团本/单体天赋代码 CkQAAAAAAAAAAAAAAAAAAAAAAAmZmZmZEzmBmtZmZY2GAAAwMjZWmZM2MzMLMzMDAYmxyyADYAzwWghtZAAAAAAAAgZmZzA --大秘/AOE灵魂收割者天赋…

S2-防护-圣骑士Paladin-团体-大秘境-专精-天赋-配装-宏

S2毕业装--属性 精通26-28>急速>爆击>全能 精通保持在26-28之间。急速和爆击越高越好。不要全能。 --团本天赋(更新时间2月5日)--团本天赋代码 CIEA5ba6OK14IUITjS1kSUVJctMmZMzyMLjZmZmx2MmhhZYAAAGAAAAAAASmZWMMDGzMzWAAGAgZw2AAAgAMzsst02MjFzAAMzYGGD --大秘天赋(…

S2-元素-萨满Shaman-团体-大秘境-专精-天赋-配装-宏

S2毕业装--属性 精通>急速>爆击>全能 精通和急速越高越好。爆击随缘。不要全能。 --团本/单体天赋(更新时间2月10日)--团本/单体天赋代码 CYQAYp+JUk5Lea12OyacsLNThAAAAAAMbzyyMjZGzysMGMYmBAAAAAWMzGMgJY2YCZWAAz20MgtFzMTDzMzYYZmZGMLDWGzMzMDzsxA -大秘/AOE天赋(更…

echarts: legend自定义icon

1.引入图片 import iconUrl from ../assets/gas_station.png;2.在legend里面定义icon legend: {data: [审批完成, 待审批, 驳回],icon: (image:// + iconUrl + ),itemWidth: 20,itemHeight: 20},

6、合并创作

拖动素材 根据情况合理进行分割裁剪

VUE-浅谈对双向绑定的理解

VUE-浅谈对双向绑定的理解 一、定义 一种MVVM模型,通过model、view、viewModel进行双向绑定 二、组成部分 1、数据层 model: 存储数据及业务逻辑 2、视图层 view:展示效果 3、业务逻辑层 viewModel:关联数据和视图 从而进行双向绑定 三、viewModel运行原理: 1、observer:对所…

WPF基础篇

第一章 窗体的基本属性<Window x:Class="zhaoxi.MainWindow"xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"xmlns:d="http://schemas.microsoft.com/expre…

阿里云可观测全面拥抱 OpenTelemetry 社区

阿里云作为全球领先的云服务商,始终站在开源观测技术最前沿。深度参与 OTel 社区,坚定支持技术开放生态与全球兼容性技术标准的构建。作者:古琦 在云计算、微服务、容器化等技术重塑 IT 架构的今天,系统复杂度呈指数级增长。在此背景下,开源可观测性技术已从辅助工具演变为…

delphi 协程应用之【协程批量并行下载组件】TdjDownloader,与迅雷一样

下载的问题 我们在开发中,经常要下载一些东西,比如软件的升级包、或模块 bpl、或在线升级等;然后 delphi 官方没有提供下载组件,若开发者自己开发 下载组件,估计很多开发者目前都是使用 主线程 + httpclient 来进行单线程下载,效率低下;原因如下:I/O(输入/输出)操作的…

对C++书店管理系统的逆向分析

书店管理系统逆向分析报告 一、程序概述该程序为基于命令行的书店管理系统,主要功能包括买家管理、书籍管理和订单管理。支持三种买家类型(会员/普通/贵宾)的差异化折扣策略,并通过文件系统实现数据持久化存储。程序通过类继承实现多态,整体采用模块化设计思想。点击查看代…