Claude Opus 4.7

Claude Opus 4.7 – Anthropic 推出的最新旗舰大模型

Claude Opus 4.7：Anthropic 旗舰模型再进化，引领 AI 新纪元

Anthropic 隆重推出其最新一代旗舰级大型语言模型——Claude Opus 4.7，这款模型是 Claude Opus 4.6 的一次重大升级，在多个关键领域实现了突破性进展，尤其是在高级软件工程任务、超高分辨率视觉处理以及长程自主执行能力方面，展现出卓越的性能。Claude Opus 4.7 已全面登陆 Claude 的全系产品、API 接口以及 Amazon Bedrock 等主流云服务平台，为全球用户提供更强大的 AI 能力。

Claude Opus 4.7 的核心亮点

Claude Opus 4.7 凭借其在多个维度的显著提升，重新定义了大型语言模型的性能标杆：

软件工程领域的尖端表现：在 SWE-bench Pro 测试中，Claude Opus 4.7 的得分高达 64.3%，标志着其在处理复杂、耗时软件开发任务方面具备了前所未有的自主性和准确性。模型能够完成编程任务，并进行自我验证，大大提高了开发效率和质量。
颠覆性的视觉分辨率支持：模型现已支持高达 2,576 像素（约合 375 万像素）的长边图像输入，相较于前代模型，其视觉分辨率提升超过三倍。这意味着 Claude Opus 4.7 能够精细地理解和分析包含密集截图、复杂技术图表、化学结构甚至像素级细节的图像内容。
强大的自我修正与自主执行能力：Claude Opus 4.7 引入了先进的自我验证机制，能在输出最终结果前主动检测并修正逻辑错误，确保输出的准确性和可靠性。此外，模型还具备了长程自主执行能力，能够连续数小时稳定地执行多步骤的复杂工作流，保持任务的连贯性和一致性。
多模态理解的深度拓展：结合其增强的视觉处理能力，Claude Opus 4.7 能够精准解读各种复杂视觉信息，为计算机视觉代理、自动化渗透测试以及生命科学研究等领域带来新的应用可能。
智能工具调用的优化：通过支持 MCP-Atlas 等扩展工具链，Claude Opus 4.7 大幅降低了工具调用错误率，约减少了三分之一，进一步提升了模型在执行复杂任务时的效率和稳定性。
增强的记忆与上下文管理：模型引入了“文件系统记忆”功能，能够在跨多会话的长任务中记住关键信息，减少了重复输入上下文的需要，提升了用户体验和任务效率。
新增的“effort”档位与任务预算控制：为了更精细地控制模型的响应规模和计算资源，Claude Opus 4.7 新增了 xhigh effort 档位，位于 high 和 max 之间。Claude Code 已默认采用此档位。同时，新增的 Task Budgets 功能允许用户为长任务设置 token 预算，由模型自主分配资源，实现更高效的资源管理。
Claude Code 的专属增强功能：Claude Code 新增了 /ultrareview 命令，用户可启动的审查会话，对代码改动进行深度检查，发现潜在问题。Auto mode 也已下放至 Max 用户，提供了更灵活的安全选项。

如何解锁 Claude Opus 4.7 的强大功能

用户可以通过多种途径便捷地体验 Claude Opus 4.7 的强大能力：

平台访问：
- 在 Claude 网页版或 App 中，只需在模型选择器中切换至 Opus 4.7 即可。
- 通过 API 调用时，模型 ID 为 claude-opus-4-7。用户可通过 Anthropic API、Amazon Bedrock、Google Cloud Vertex AI 或 Microsoft Foundry 进行调用。
- Claude Code 用户可直接体验默认切换至 xhigh effort 档位带来的提升，并可使用 /ultrareview 命令进行深度代码审查。
API 关键参数配置：
- effort 参数：用于控制响应规模，可选值为 low,medium,high,xhigh,max。对于编程和 agentic 场景，建议从 high 或 xhigh 开始。
- task budgets（公测）：用于设定长任务的 token 预算，由模型自主管理资源分配，与 effort 参数结合使用效果更佳。
- thinking 参数：原有的 thinking: {type: "enabled"， budget_tokens: N} 已被弃用，现统一使用 thinking: {type: "adaptive"} 配合 effort 参数。
高分辨率图像处理：用户可直接上传长边不超过 2,576 像素的原始图像，无需进行预先压缩，模型将自动高效处理高分辨率输入。
Claude Code 特有指令：
- 输入 /ultrareview 即可启动的深度代码审查会话（Pro 和 Max 用户每月享有三次免费额度）。
- Auto mode 已向 Max 用户开放，提供介于 --dangerously-skip-permissions 和默认模式之间的安全选项。

Claude Opus 4.7 的关键信息与使用须知

模型定位与发布：作为 Opus 4.6 的直接升级版，Claude Opus 4.7 是 Anthropic 的最新旗舰模型，现已全面覆盖 Claude 各产品线、API 接口以及 Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry 等主流云平台。
核心技术亮点：在高级软件工程能力（SWE-bench Pro 64.3%）和视觉分辨率（长边 2,576 像素）方面实现了显著飞跃，并强化了自我验证与长程自主执行能力。
定价策略：Claude Opus 4.7 沿用了 Opus 4.6 的价格体系，输入 token 费用为 $5/百万，输出 token 费用为 $25/百万，模型 ID 为 claude-opus-4-7。
Tokenizer 变化：请注意，新 tokenizer 下相同文本的 token 数量约为旧版的 1.0–1.35 倍，建议在调用时预留更充裕的 token 预算。

Claude Opus 4.7 的核心竞争力

Claude Opus 4.7 在多项关键指标上超越了前代，展现出强大的竞争优势：

高难度编程的质的飞跃：SWE-bench Pro 得分提升 11 个百分点至 64.3%，使其在处理最复杂的软件工程任务时表现更加出色。
可靠的自我验证机制：模型在交付结果前进行自主的逻辑检查与修正，极大地减少了人工干预的需求，显著增强了长任务的可靠性。
视觉感知能力的性提升：支持 2,576 像素长边图像，视觉感知基准得分从 54.5% 飙升至 98.5%，为图像分析带来了前所未有的精度。
长程任务的稳定执行：能够数小时不间断地执行复杂的多步骤工作流，即使遇到困难也能保持稳定性和一致性，不会轻易放弃。
指令遵循的精准度大幅提升：模型对用户指令的字面执行精度显著提高，有效避免了模糊理解，确保任务准确按照用户意图完成。
工具调用效率的优化：工具调用错误率降低约三分之一，在多步 agentic 场景下，token 使用效率得到显著提升。

Claude Opus 4.7 的应用前景广阔

Claude Opus 4.7 的强大功能使其在众多领域展现出巨大的应用潜力：

复杂软件开发：能够高效处理大规模代码重构、复杂算法实现等高难度任务，GitHub 实测任务解决率提升 13%，并能在执行过程中进行自我验证。
高分辨率视觉分析：适用于需要精细化图像解读的场景，如计算机视觉代理、自动化安全审计以及生物医药领域的研究。
长程自主工作流构建：能够自动化执行跨多会话的深度数据分析、研究报告生成等复杂任务，保持长时运行的稳定性和连贯性。
金融与商业智能化分析：在财务建模、投资分析、商业演示文稿生成等方面表现出色，Finance Agent v1.1 基准测试得分 64.4%，可产出严谨的分析模型和高质量的商业交付物。

阅读原文