GPT-4.1

GPT-4.1 – OpenAI 推出新一代语言模型,支持百万 token 上下文

GPT-4.1

GPT-4.1 是 OpenAI 最新发布的一款先进语言模型,分为 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 三个版本。这些模型在编码能力、指令遵循和长文本处理等方面都有显著提升,具备高达 100 万个 token 的上下文窗口,能够更高效地处理复杂的文本和代码。

GPT-4.1是什么

GPT-4.1 是 OpenAI 推出的新一代语言模型,包含三个版本:GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。该系列模型在编码能力、遵循指令和处理长文本方面表现出色,支持高达 100 万个 token 的上下文窗口。在多项基准测试中,GPT-4.1 的表现尤为突出,例如,在 SWE-bench Verified 测试中,得分达到了 54.6%,比前一版本 GPT-4o 提高了 21.4 个百分点。此外,GPT-4.1 系列模型的运行成本较低,成为当前速度最快且性价比最高的选择。该系列模型现已通过 API 向所有开发者开放。

主要功能

  • 长上下文处理能力:支持高达 100 万个 token 的上下文,使得模型能够处理更为庞大的文本,如整本书籍或大型代码库。
  • 多模态处理:采用了优化的视觉和文本编码器,具有交叉注意力机制,能更有效地处理图文混合内容。
  • 代码生成与优化:在编程任务上展现出色,准确率达到 54.6%,比 GPT-4o 提高了 21.4 个百分点,能够高效地探索代码库并生成测试用例。
  • 多语言支持:在多语言编码能力测试中,性能提升一倍,处理多语言编程任务时更为高效。
  • 工具调用效率:在实际应用中,如 Windsurf 的内部编码基准测试,得分较 GPT-4o 提高了 60%,工具调用效率提升了 30%。
  • 复杂指令处理:在指令遵循方面表现卓越,得分较 GPT-4o 提高了 10.5 个百分点。
  • 多轮对话能力:在多轮对话中,能够更好地跟踪上下文,确保对话的连贯性。
  • 超大上下文窗口:支持高达 100 万个 token 的上下文处理能力,是 GPT-4o 的 8 倍,能处理超长文本。
  • 长文本理解:能够准确定位和提取关键信息,在长达 100 万个 token 的上下文中表现突出。
  • 图像理解:在图像理解方面,GPT-4.1 mini 的表现常常超越 GPT-4o。
  • 视频内容理解:在 Video-MME 测试中,能理解 30 到 60 分钟无字幕的视频,并取得 72% 的成绩,达到了当前最佳水平。
  • 高性价比:在性能上升的同时,成本更低,GPT-4.1 的中等规模查询成本比 GPT-4o 低 26%。
  • 低延迟与高效率:GPT-4.1 mini 的延迟减少了近一半,成本降低了 83%,适合低延迟任务。

产品官网

应用场景

  • 法律领域:在法律文档审核中,GPT-4.1 的多文档审查准确率比 GPT-4o 提高了 17%,高效处理复杂法律文件。
  • 金融分析:在金融数据分析中,能够从大型文档中更准确地提取关键信息,为分析师提供全面的数据支持。
  • 前端开发:在前端编程方面,能够生成功能更强大且美观的网页应用,生成的网站在 80% 的情况下更受人类评审员青睐。

常见问题

  • GPT-4.1的定价是多少?
    GPT-4.1 的定价为每百万输入标记 2 美元,每百万输出标记 8 美元;GPT-4.1 mini 每百万输入标记 0.4 美元,每百万输出标记 1.6 美元;GPT-4.1 nano 每百万输入标记 0.1 美元,每百万输出标记 0.4 美元。
  • GPT-4.1支持哪些语言?
    GPT-4.1 支持多种语言,尤其在多语言编码能力上表现优异。
  • 如何使用GPT-4.1?
    开发者可以通过 API 接口访问 GPT-4.1 系列模型,进行各种应用开发。
阅读原文
© 版权声明
Trae官网

相关文章

Trae官网

暂无评论

暂无评论...