用心打造
VPS知识分享网站

Anthropic推出Claude Opus 4和Claude Sonnet 4,智能代理和人工智能编码的新时代

Anthropic 发布了其最新的 Claude 4 系列产品,对于任何想要构建下一代 AI 助手或进行编程的人来说,这都堪称一次飞跃。此次发布的明星产品包括全新动力强劲的 Claude Opus 4 和旨在打造智能全能型产品的 Claude Sonnet 4。

Anthropic 毫不掩饰自己的雄心壮志,声称这些模型旨在“全面推进客户的 AI 战略”。他们将 Opus 4 定位为“突破编码、研究、写作和科学发现界限”的工具,而 Sonnet 4 则被称为“Sonnet 3.7 的即时升级版”,随时准备为“日常用例带来前沿性能”。

Anthropic推出Claude Opus 4和Claude Sonnet 4,智能代理和人工智能编码的新时代

Claude Opus 4:新一代编码冠军

当 Anthropic 称 Claude Opus 4 是其“迄今为止最强大的模型,也是世界上最好的编码模型”时,你一定会刮目相看。他们有数据支撑这一说法:Opus 4 在关键的行业测试中名列前茅,在 SWE-bench 上达到了 72.5%,在 Terminal-bench 上达到了 43.2%。

但它的意义远不止快速冲刺。Opus 4 专为长期发展而打造,旨在“在需要专注和数千步操作的长期任务中保持持续性能”。想象一下,一个人工智能能够“连续工作数小时”——这就是 Anthropic 的宣传语。

这应该是对之前 Sonnet 模型的一次巨大进步,并且可以扩展 AI 代理可以实现的功能,解决需要真正坚持的问题。

Claude Sonnet 4:用于日常人工智能和代理工作

虽然 Opus 4 是重量级冠军,但 Claude Sonnet 4 正逐渐成为功能多样的强劲动力,有望为众多应用程序带来显著提升。早期试用用户的反馈非常热烈。

例如,GitHub “表示 Claude Sonnet 4 在代理场景中表现出色”,并对其印象深刻,以至于“计划将其作为 GitHub Copilot 中新编码代理的基础模型引入”。这是一个强有力的认可。 

科技评论员马努斯也对此印象深刻,强调其“在遵循复杂指令、清晰推理和美观输出方面的改进”。

iGent 继续展现出积极的氛围,它“报告称 Sonnet 4 在自主多功能应用程序开发方面表现出色,并且显著改进了问题解决和代码库导航——将导航错误从 20% 降低到接近零。”这将彻底改变开发工作流程。 

Sourcegraph 也同样乐观,认为该模型是“软件开发的一次重大飞跃——能够更长时间地保持正轨,更深入地理解问题,并提供更优雅的代码质量。”

Augment Code 已经实现了“更高的成功率、更多的外科手术代码编辑以及在复杂任务中更细致的工作”,这使得他们将 Sonnet 4 选为“其主要模型的首选”。

混合模式和开发者乐趣

Claude 4 家族的一大亮点在于其混合特性。Opus 4 和 Sonnet 4 都可以在两种模式下运行:一种是我们经常需要的近乎即时的回复,另一种则允许“进行扩展思考,以进行更深入的推理”。

这种深度思考模式是 Claude Pro、Max、Team 和 Enterprise 计划的一部分。不过,好消息是,配备了这种扩展思考功能的 Sonnet 4 也将向免费用户开放,这对于让顶级 AI 更容易普及来说是一个绝佳的举措。

Anthropic 还在其 API 上为开发人员推出了一些有趣的新工具,显然旨在增强更复杂的 AI 代理的创建:

  • 代码执行工具:这让模型能够实际运行代码,为交互式和解决问题的应用程序开辟各种可能性。
  • MCP 连接器:由 Anthropic 推出的 MCP 标准化了 AI 助手和软件环境之间的上下文交换。
  • 文件 API:这将使 AI 更容易直接处理文件,这对于许多现实世界的任务来说意义重大。
  • 提示缓存:开发人员将能够将提示缓存长达一小时。这听起来可能很小,但它可以真正提高速度和效率,尤其是对于频繁使用的查询。

现实世界表现领先

Anthropic 极力强调其“Claude 4 模型在 SWE-bench Verified(真实软件工程任务性能基准)上处于领先地位”。除了编码之外,他们还强调这些模型“在编码、推理、多模态能力和代理任务方面都表现出色”。

对 Claude 4 Opus 和 Sonnet AI 模型与包括 OpenAI o3 和 Gemini 2.5 Pro 在内的竞争对手进行基准比较。

尽管性能飞跃,Anthropic 仍坚持定价策略。Claude Opus 4 的价格为每百万输入代币 15 美元,每百万输出代币 75 美元。Claude Sonnet 4 的价格更亲民,为每百万输入代币 3 美元,每百万输出代币 15 美元。这种价格一致性将受到现有用户的欢迎。

Claude Opus 4 和 Sonnet 4 均已准备好通过 Anthropic API 运行,并且它们也已在 Amazon Bedrock 和 Google Cloud 的 Vertex AI 上线。这种广泛的可用性意味着全球的企业和开发者可以相当轻松地开始尝试和集成这些新工具。

Anthropic 显然正在加倍努力,致力于提升人工智能的能力,尤其是在复杂的编码和自主代理行为领域。有了这些新的模型和开发工具,创新潜力将得到显著提升。

赞(0)
未经允许不得转载;国外VPS测评网 » Anthropic推出Claude Opus 4和Claude Sonnet 4,智能代理和人工智能编码的新时代
分享到