MiniMax M2.7

稀宇科技隆重推出其新一代人工智能模型——MiniMax M2.7，这款模型在技术突破上独树一帜，能够自主构建Agent Harness，不断优化自身的训练流程，并积极参与到自身的迭代进化过程中。

MiniMax M2.7 究竟是何方神圣

MiniMax M2.7 是稀宇科技倾力打造的全新一代人工智能模型，其核心亮点在于其强大的自主能力。它不仅能自行搭建Agent Harness，还能高效地优化自身的训练过程，从而实现自我更新和迭代。在软件工程领域，M2.7 展现出非凡的实力，其SWE-Pro得分高达56.22%，已接近国际顶尖水平。它能够胜任端到端的项目交付、疑难 Bug 的排查、代码安全性的保障等一系列复杂任务。此外，在专业办公领域，M2.7 在GDPval-AA评测中荣获开源模型的最高ELO评分1495分，充分证明了其精通Office三大件（Word、Excel、PPT）的高保真编辑能力。模型还具备卓越的情商表现和身份维持能力，目前已全面上线MiniMax Agent及开放平台。

MiniMax M2.7 的主要亮点功能

自我革新：MiniMax M2.7 能够自主搭建Agent Harness，从而驱动模型的自我迭代与持续优化。
软件开发利器：该模型支持从头到尾的项目交付，包括日志分析、Bug 定位、代码重构、代码安全审计，乃至机器学习任务的开发和安卓应用的构建，全面覆盖真实工程场景。
高效办公助手：精通 Excel、PPT、Word 的深度编辑与多轮次高保真修改。它能阅读研究报告，进行信息交叉比对，构建财务预测模型，并基于模板生成专业级的 PPT 报告和 Word 文档。
Agent 智能协作：原生支持多智能体协作，能够保持角色边界、进行对抗性推理并遵循协议，无需繁琐的提示词即可实现团队任务的分工与协同。
工具调用专家：拥有强大的复杂 Skill 调用和 Tool Search 能力，即便在超过2000 Token的长程交互中，也能保持高达97%的指令遵循率，灵活适应各种上下文环境。
互动娱乐伙伴：具备出色的情商和身份保持能力，支持自然流畅的对话交互，可应用于OpenRoom等可视化互动场景，带来沉浸式体验。

MiniMax M2.7 的技术基石

自我进化架构：基于Agent Harness框架，模型能够自主构建包含数据流水线、训练环境和评测基础设施的复杂技能体系。通过短时记忆、自反馈和自优化这三个核心模块，形成一个迭代闭环，执行分析失败轨迹、规划改进方案、修改代码、运行评测、对比结果，并最终决定保留或回退，实现自主优化。
强化学习驱动：模型能够自行构建RL Harness中的数十个复杂技能，并自主更新其记忆。系统性地搜索温度、频率惩罚等采样参数的最优组合，并设计如修复后自动搜索相同Bug模式等具体工作流指导。
Agent Teams 原生能力：将角色边界、对抗性推理、协议遵循等能力内化为模型原生能力，而非依赖于提示词工程，从而支持在复杂状态机中进行自主决策和多智能体协作。
长程交互稳定性：借助持久化的记忆系统，模型在处理40个超过2000 Token的复杂技能时，仍能保持97%的指令遵循率，确保多轮复杂任务的可靠执行。

MiniMax M2.7 的关键信息及使用要求

发布方：MiniMax 稀宇科技
模型定位：首个深度参与自身迭代的自我进化模型
核心亮点：自我进化、卓越的软件工程能力、高效的专业办公能力、智能的Agent协作
主要评测成绩：SWE-Pro 56.22%、GDPval-AA ELO 1495（开源最高）、MM-Claw 62.7%
上线状态：已全面上线MiniMax Agent及开放平台
访问方式：可通过MiniMax Agent或API服务进行访问

MiniMax M2.7 的核心优势

开创性的自我进化能力：作为业界首个能够深度参与自身迭代的模型，它能自主构建Agent Harness、优化训练流程、更新记忆系统，形成一个完整的自我进化循环。
顶尖的软件工程实力：在真实开发场景中表现卓越，SWE-Pro得分达到56.22%，逼近国际顶尖水平，能够处理端到端的项目交付、日志分析、Bug定位、代码安全等复杂任务。
开源领域最强的办公能力：GDPval-AA评测中的ELO得分1495，位居开源模型之首，精通Office三大件的高保真编辑，能够完成研究报告分析、财务建模以及专业报告的生成。
原生的Agent协作能力：将角色边界、对抗性推理、协议遵循等能力内化为模型自身能力，无需复杂的提示词即可实现多智能体团队的无缝协作。
超长程交互的稳定表现：在40个超过2000 Token的复杂技能上保持97%的指令遵循率，持久化的记忆系统确保了多轮复杂任务的可靠执行。

如何体验 MiniMax M2.7

MiniMax Agent：访问MiniMax Agent官网，即可直接体验模型的对话能力。
API 服务：开发者可通过访问 http://platform.minimaxi.com/ 来集成模型能力。

MiniMax M2.7 与同类竞品对比

维度	MiniMax M2.7	Claude Opus 4.6	GPT-5.4
自我进化	✅ 首创，模型参与自身迭代	❌ 无	❌ 无
SWE-Pro	56.22%	约56%+	未公开具体分数
GDPval-AA	1495（开源最高）	约1500+（闭源最强）	约1490
MM-Claw	62.7%	接近水平	未明确评测
开源属性	部分开源	闭源	闭源
国内可用	✅ 直接访问	⚠️ 需代理	⚠️ 需代理
核心优势	自我进化+真实工程+高性价比	综合最强+长文本处理	通用能力+生态丰富

MiniMax M2.7 的应用场景展望

软件开发领域：MiniMax M2.7 能够完成从需求分析到代码交付的全过程软件工程任务，包括生产环境的故障排查与修复，以及移动端应用的开发。
专业办公场景：MiniMax M2.7 在处理Office三大件的高保真编辑方面表现出色，能够自主阅读研究报告并构建财务预测模型，最终生成专业的数据分析报告和演示文稿。
智能协作模式：MiniMax M2.7 支持多智能体团队协作，可在复杂项目中实现角色分工、对抗性推理和协议遵循，无需人工干预即可完成团队任务。
工具自动化应用：MiniMax M2.7 拥有强大的工具使用能力，能在长程交互中保持稳定的指令遵循，自动调用各类Skills来完成跨系统的数据整合与信息调研任务。
互动娱乐体验：MiniMax M2.7 具备优秀的身份保持能力和情商，支持沉浸式角色扮演和自然对话，可在OpenRoom等可视化空间中实现实时的场景探索。

MiniMax M2.7

MiniMax M2.7 – MiniMax推出的自我进化模型

MiniMax M2.7 究竟是何方神圣

MiniMax M2.7 的主要亮点功能

MiniMax M2.7 的技术基石

MiniMax M2.7 的关键信息及使用要求

MiniMax M2.7 的核心优势

如何体验 MiniMax M2.7

MiniMax M2.7 与同类竞品对比

MiniMax M2.7 的应用场景展望

SkyClaw

MindVLA-o1

相关文章

暂无评论