突发！Anthropic发布Claude 3.7 Sonnet：首个混合推理模型，编程能力全面领先

使用教程1年前 (2025)更新科技未来派

原标题：突发！Anthropic发布Claude 3.7 Sonnet：首个混合推理模型，编程能力全面领先
文章来源：科技未来派
内容字数：2590字

Anthropic发布Claude 3.7 Sonnet：混合推理引领AI编程新时代

人工智能领域持续革新，Anthropic近日发布了其最新大型语言模型Claude 3.7 Sonnet，并同步推出专业编码工具Claude Code，在AI编程和复杂推理领域掀起波澜。这款模型并非简单的版本迭代，而是代表着一种全新的“混合推理”模式的诞生，为AI辅助编程和复杂问题求解带来了前所未有的可能性。

混合推理：深度思考与快速响应的完美结合

Claude 3.7 Sonnet最显著的突破在于其独特的混合推理能力。它同时具备两种思考模式：标准模式提供近乎实时的响应，如同Claude 3.5 Sonnet的升级版；而扩展思维模式则允许模型在回答前进行自我反思，从而显著提升其在数学、物理、编程等复杂任务中的表现。这种设计理念模拟了人类大脑同时具备快速反应和深度思考的能力，与市场上其他模型形成了鲜明对比。

精准控制：掌控AI的思考深度

更令人兴奋的是，Claude 3.7 Sonnet的API用户可以精确控制模型的思考深度，通过指定token数量（最高可达128K）来调节模型的推理过程。实验结果表明，在AIME 2024数学竞赛中，允许模型思考的token数量越多，其解题准确率就越高，充分展现了这种精准控制机制的有效性。

编程能力的飞跃：超越现有模型

在编程能力方面，Claude 3.7 Sonnet展现出了令人瞩目的实力。它成功实现了复杂的p5.js球体弹跳物理模拟，以及其他模型（如Grok 3和O1-pro）无法解决的布料物理模拟。在Pokemon游戏测试中，它甚至击败了三个道馆馆主，而其前代模型甚至无法离开起始房间。此外，其“vibe coding”功能也受到了广泛好评，能够帮助非专业开发者轻松解决复杂的编程问题。

Claude Code：专业编码工具，提升效率

除了Claude 3.7 Sonnet本身，Anthropic还推出了专业编码工具Claude Code（目前仍处于预览版）。这款工具能够搜索和阅读代码库、编辑文件、编写和运行测试，甚至可以直接提交和推送代码到GitHub，并支持命令行工具。早期测试表明，Claude Code能够在几分钟内完成原本需要45分钟以上才能手动完成的任务，大幅提升了开发效率。

广泛的平台支持与亲民的价格

Claude 3.7 Sonnet已在多个平台上线，包括Claude.ai网站、亚马逊云服务Bedrock平台和谷歌云平台。其定价与前代保持一致，每百万输入token 3美元，每百万输出token 15美元（包括思考token）。所有付费版本都支持扩展思维模式，为用户提供了更强大的AI辅助能力。

实际应用效果的提升：更安全，更精准

除了技术指标上的提升，Anthropic还对模型的实际应用效果进行了优化。它能够更精确地区分有害请求和良性请求，不必要的拒绝率降低了45%；在GPQA评估中取得了84.8%的分数，物理子类别得分更是高达96.5%；解决实际概率问题的能力也得到了大幅提升。

结语：混合推理引领AI未来

Claude 3.7 Sonnet的发布并非简单的版本更新，而是混合推理能力的性突破。它代表着AI技术发展的一个重要里程碑，将为AI辅助编程、复杂推理任务以及其他众多领域带来新的可能性。随着该模型的普及，我们可以期待AI在更多领域发挥更大的作用，推动科技进步，造福人类。

联系作者

文章来源：科技未来派
作者微信：
作者简介：追踪人工智能新趋势，关注科技行业新突破

阅读原文

# 使用教程 # Anthropic # Claude37Sonnet # 大型语言模型推理 # 混合推理模型 # 编程能力

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

突发！Anthropic发布Claude 3.7 Sonnet：首个混合推理模型，编程能力全面领先

Anthropic发布Claude 3.7 Sonnet：混合推理引领AI编程新时代

混合推理：深度思考与快速响应的完美结合

精准控制：掌控AI的思考深度

编程能力的飞跃：超越现有模型

Claude Code：专业编码工具，提升效率

广泛的平台支持与亲民的价格

实际应用效果的提升：更安全，更精准

结语：混合推理引领AI未来

联系作者

DeepSeek 爆火，25 年 AI 行业如何发展？

没想到！Claude 3.7 Sonnet 深夜上线，可以免费使用！

相关文章

暂无评论