GPT-4.1

AI工具1年前 (2025)更新 AI工具集

GPT-4.1 – OpenAI 推出新一代语言模型，支持百万 token 上下文

GPT-4.1

GPT-4.1 是 OpenAI 最新发布的一款先进语言模型，分为 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 三个版本。这些模型在编码能力、指令遵循和长文本处理等方面都有显著提升，具备高达 100 万个 token 的上下文窗口，能够更高效地处理复杂的文本和代码。

GPT-4.1是什么

GPT-4.1 是 OpenAI 推出的新一代语言模型，包含三个版本：GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。该系列模型在编码能力、遵循指令和处理长文本方面表现出色，支持高达 100 万个 token 的上下文窗口。在多项基准测试中，GPT-4.1 的表现尤为突出，例如，在 SWE-bench Verified 测试中，得分达到了 54.6%，比前一版本 GPT-4o 提高了 21.4 个百分点。此外，GPT-4.1 系列模型的运行成本较低，成为当前速度最快且性价比最高的选择。该系列模型现已通过 API 向所有开发者开放。

主要功能

长上下文处理能力：支持高达 100 万个 token 的上下文，使得模型能够处理更为庞大的文本，如整本书籍或大型代码库。
多模态处理：采用了优化的视觉和文本编码器，具有交叉注意力机制，能更有效地处理图文混合内容。
代码生成与优化：在编程任务上展现出色，准确率达到 54.6%，比 GPT-4o 提高了 21.4 个百分点，能够高效地探索代码库并生成测试用例。
多语言支持：在多语言编码能力测试中，性能提升一倍，处理多语言编程任务时更为高效。
工具调用效率：在实际应用中，如 Windsurf 的内部编码基准测试，得分较 GPT-4o 提高了 60%，工具调用效率提升了 30%。
复杂指令处理：在指令遵循方面表现卓越，得分较 GPT-4o 提高了 10.5 个百分点。
多轮对话能力：在多轮对话中，能够更好地跟踪上下文，确保对话的连贯性。
超大上下文窗口：支持高达 100 万个 token 的上下文处理能力，是 GPT-4o 的 8 倍，能处理超长文本。
长文本理解：能够准确定位和提取关键信息，在长达 100 万个 token 的上下文中表现突出。
图像理解：在图像理解方面，GPT-4.1 mini 的表现常常超越 GPT-4o。
视频内容理解：在 Video-MME 测试中，能理解 30 到 60 分钟无字幕的视频，并取得 72% 的成绩，达到了当前最佳水平。
高性价比：在性能上升的同时，成本更低，GPT-4.1 的中等规模查询成本比 GPT-4o 低 26%。
低延迟与高效率：GPT-4.1 mini 的延迟减少了近一半，成本降低了 83%，适合低延迟任务。

产品官网

项目官网：https://openai.com/index/gpt-4-1/

应用场景

法律领域：在法律文档审核中，GPT-4.1 的多文档审查准确率比 GPT-4o 提高了 17%，高效处理复杂法律文件。
金融分析：在金融数据分析中，能够从大型文档中更准确地提取关键信息，为分析师提供全面的数据支持。
前端开发：在前端编程方面，能够生成功能更强大且美观的网页应用，生成的网站在 80% 的情况下更受人类评审员青睐。

常见问题

GPT-4.1的定价是多少？
GPT-4.1 的定价为每百万输入标记 2 美元，每百万输出标记 8 美元；GPT-4.1 mini 每百万输入标记 0.4 美元，每百万输出标记 1.6 美元；GPT-4.1 nano 每百万输入标记 0.1 美元，每百万输出标记 0.4 美元。
GPT-4.1支持哪些语言？
GPT-4.1 支持多种语言，尤其在多语言编码能力上表现优异。
如何使用GPT-4.1？
开发者可以通过 API 接口访问 GPT-4.1 系列模型，进行各种应用开发。

阅读原文