稀宇科技隆重推出其新一代人工智能模型——MiniMax M2.7,这款模型在技术突破上独树一帜,能够自主构建Agent Harness,不断优化自身的训练流程,并积极参与到自身的迭代进化过程中。
MiniMax M2.7 究竟是何方神圣
MiniMax M2.7 是稀宇科技倾力打造的全新一代人工智能模型,其核心亮点在于其强大的自主能力。它不仅能自行搭建Agent Harness,还能高效地优化自身的训练过程,从而实现自我更新和迭代。在软件工程领域,M2.7 展现出非凡的实力,其SWE-Pro得分高达56.22%,已接近国际顶尖水平。它能够胜任端到端的项目交付、疑难 Bug 的排查、代码安全性的保障等一系列复杂任务。此外,在专业办公领域,M2.7 在GDPval-AA评测中荣获开源模型的最高ELO评分1495分,充分证明了其精通Office三大件(Word、Excel、PPT)的高保真编辑能力。模型还具备卓越的情商表现和身份维持能力,目前已全面上线MiniMax Agent及开放平台。
MiniMax M2.7 的主要亮点功能
- 自我革新:MiniMax M2.7 能够自主搭建Agent Harness,从而驱动模型的自我迭代与持续优化。
- 软件开发利器:该模型支持从头到尾的项目交付,包括日志分析、Bug 定位、代码重构、代码安全审计,乃至机器学习任务的开发和安卓应用的构建,全面覆盖真实工程场景。
- 高效办公助手:精通 Excel、PPT、Word 的深度编辑与多轮次高保真修改。它能阅读研究报告,进行信息交叉比对,构建财务预测模型,并基于模板生成专业级的 PPT 报告和 Word 文档。
- Agent 智能协作:原生支持多智能体协作,能够保持角色边界、进行对抗性推理并遵循协议,无需繁琐的提示词即可实现团队任务的分工与协同。
- 工具调用专家:拥有强大的复杂 Skill 调用和 Tool Search 能力,即便在超过2000 Token的长程交互中,也能保持高达97%的指令遵循率,灵活适应各种上下文环境。
- 互动娱乐伙伴:具备出色的情商和身份保持能力,支持自然流畅的对话交互,可应用于OpenRoom等可视化互动场景,带来沉浸式体验。
MiniMax M2.7 的技术基石
- 自我进化架构:基于Agent Harness框架,模型能够自主构建包含数据流水线、训练环境和评测基础设施的复杂技能体系。通过短时记忆、自反馈和自优化这三个核心模块,形成一个迭代闭环,执行分析失败轨迹、规划改进方案、修改代码、运行评测、对比结果,并最终决定保留或回退,实现自主优化。
- 强化学习驱动:模型能够自行构建RL Harness中的数十个复杂技能,并自主更新其记忆。系统性地搜索温度、频率惩罚等采样参数的最优组合,并设计如修复后自动搜索相同Bug模式等具体工作流指导。
- Agent Teams 原生能力:将角色边界、对抗性推理、协议遵循等能力内化为模型原生能力,而非依赖于提示词工程,从而支持在复杂状态机中进行自主决策和多智能体协作。
- 长程交互稳定性:借助持久化的记忆系统,模型在处理40个超过2000 Token的复杂技能时,仍能保持97%的指令遵循率,确保多轮复杂任务的可靠执行。
MiniMax M2.7 的关键信息及使用要求
- 发布方:MiniMax 稀宇科技
- 模型定位:首个深度参与自身迭代的自我进化模型
- 核心亮点:自我进化、卓越的软件工程能力、高效的专业办公能力、智能的Agent协作
- 主要评测成绩:SWE-Pro 56.22%、GDPval-AA ELO 1495(开源最高)、MM-Claw 62.7%
- 上线状态:已全面上线MiniMax Agent及开放平台
- 访问方式:可通过MiniMax Agent或API服务进行访问
MiniMax M2.7 的核心优势
- 开创性的自我进化能力:作为业界首个能够深度参与自身迭代的模型,它能自主构建Agent Harness、优化训练流程、更新记忆系统,形成一个完整的自我进化循环。
- 顶尖的软件工程实力:在真实开发场景中表现卓越,SWE-Pro得分达到56.22%,逼近国际顶尖水平,能够处理端到端的项目交付、日志分析、Bug定位、代码安全等复杂任务。
- 开源领域最强的办公能力:GDPval-AA评测中的ELO得分1495,位居开源模型之首,精通Office三大件的高保真编辑,能够完成研究报告分析、财务建模以及专业报告的生成。
- 原生的Agent协作能力:将角色边界、对抗性推理、协议遵循等能力内化为模型自身能力,无需复杂的提示词即可实现多智能体团队的无缝协作。
- 超长程交互的稳定表现:在40个超过2000 Token的复杂技能上保持97%的指令遵循率,持久化的记忆系统确保了多轮复杂任务的可靠执行。
如何体验 MiniMax M2.7
- MiniMax Agent:访问MiniMax Agent官网,即可直接体验模型的对话能力。
- API 服务:开发者可通过访问 http://platform.minimaxi.com/ 来集成模型能力。
MiniMax M2.7 与同类竞品对比
| 维度 | MiniMax M2.7 | Claude Opus 4.6 | GPT-5.4 |
|---|---|---|---|
| 自我进化 | ✅ 首创,模型参与自身迭代 | ❌ 无 | ❌ 无 |
| SWE-Pro | 56.22% | 约56%+ | 未公开具体分数 |
| GDPval-AA | 1495(开源最高) | 约1500+(闭源最强) | 约1490 |
| MM-Claw | 62.7% | 接近水平 | 未明确评测 |
| 开源属性 | 部分开源 | 闭源 | 闭源 |
| 国内可用 | ✅ 直接访问 | ⚠️ 需代理 | ⚠️ 需代理 |
| 核心优势 | 自我进化+真实工程+高性价比 | 综合最强+长文本处理 | 通用能力+生态丰富 |
MiniMax M2.7 的应用场景展望
- 软件开发领域:MiniMax M2.7 能够完成从需求分析到代码交付的全过程软件工程任务,包括生产环境的故障排查与修复,以及移动端应用的开发。
- 专业办公场景:MiniMax M2.7 在处理Office三大件的高保真编辑方面表现出色,能够自主阅读研究报告并构建财务预测模型,最终生成专业的数据分析报告和演示文稿。
- 智能协作模式:MiniMax M2.7 支持多智能体团队协作,可在复杂项目中实现角色分工、对抗性推理和协议遵循,无需人工干预即可完成团队任务。
- 工具自动化应用:MiniMax M2.7 拥有强大的工具使用能力,能在长程交互中保持稳定的指令遵循,自动调用各类Skills来完成跨系统的数据整合与信息调研任务。
- 互动娱乐体验:MiniMax M2.7 具备优秀的身份保持能力和情商,支持沉浸式角色扮演和自然对话,可在OpenRoom等可视化空间中实现实时的场景探索。


粤公网安备 44011502001135号