Leanstral – Mistral AI推出的首个开源AI代码智能体
Mistral AI 隆重推出 Leanstral,这款开创性的开源 AI 代码智能体,专为 Lean 4 定理证明器量身打造,标志着 AI 在形式化验证领域迈出了重要一步。
Leanstral:AI 赋能的 Lean 4 专家
Leanstral 是一款集成了先进稀疏专家混合(MoE)架构的 AI 模型,拥有 1200 亿总参数和 60 亿激活参数。它被设计用来自动化 Lean 4 证明过程,显著提升代码的生成效率和准确性。与市场上动辄数千亿甚至万亿参数的巨型模型相比,Leanstral 以其精巧的架构实现了令人瞩目的性能提升,并且成本效益极高,单次任务执行仅需 18 美元。在真实的数学代码库,例如著名的费马大定理项目等评测中,Leanstral 展现了卓越的实力。此外,该模型还具备通过 MCP 协议进行扩展的能力,并已无缝集成到 Mistral Vibe 平台中。
Leanstral 的核心能力
- 自动化形式化证明生成: Leanstral 能够为 Lean 4 证明助手自动生成严谨的数学证明和软件规范验证代码,极大地简化了形式化过程。
- 代码正确性严苛验证: 借助 Lean 4 强大的完备验证器,Leanstral 确保生成的代码完全符合严格的形式化规范,有效克服了传统人工审查的瓶颈。
- 智能诊断与精准修复: 该模型具备分析代码失败原因的能力,例如能够区分
def和abbrev在类型别名中的细微差别,并提供精准的修复建议。 - 跨语言代码转换: Leanstral 支持将其他证明语言(如 Rocq/Coq)的代码自动转换为 Lean 4 格式,同时保留原有的自定义符号表示,实现无缝迁移。
- 定理证明的强大助力: 在真实的数学项目(如费马大定理项目)中,Leanstral 能够完成复杂的形式化证明,并协助定义全新的数学概念。
Leanstral 的关键亮点与使用前提
- 开发者: Mistral AI
- 定位: 首个专门为 Lean 4 设计的开源 AI 代码智能体
- 架构: 稀疏专家混合(MoE),120B 总参数 / 6B 激活参数
- 许可: Apache 2.0(完全开源)
- 成本: 单次任务仅需 18 美元,pass@2 成本仅为 36 美元(相较于 Claude Sonnet 的 549 美元,极具优势)
- 性能: 在 FLTEval 评测中获得 29.3 的 pass@4 分数,表现优于大多数同类开源模型
- Mistral Vibe 集成: 零配置即可使用,只需在对话框中输入
/leanstall - Labs API: 提供限时免费的
labs-leanstral-2603端点 - 本地部署: 用户可自行下载开源权重,在本地环境中运行,实现完全的数据隐私与控制
Leanstral 的卓越优势
- 极致效率: 仅需 60 亿激活参数,便能实现超越千亿级参数模型的性能,在性能和成本之间达到完美平衡。
- 成本效益: 以单次任务 18 美元的低廉价格,提供优于 Claude Sonnet 的验证效果,成本仅为其 1/15。
- 完全开源: 基于 Apache 2.0 协议开放权重,用户无需担心供应商锁定,支持私有化部署和自主可控。
- 专注领域优化: 针对 Lean 4 证明工程进行深度训练,在真实数学代码库中的表现远超通用大模型。
- 可信验证保障: 生成的代码附带形式化数学证明,将人工审查的耗时耗力转变为机器自动验证的高效模式。
- 生态兼容性强: 原生支持 MCP 协议,能够轻松集成到现有的开发工具链和语言服务器中。
如何体验 Leanstral
- Mistral Vibe (新手推荐): 访问 Mistral Vibe 平台,在对话框中输入
/leanstall命令,即可无需任何配置启动 Leanstral。 - Labs API (开发者首选): 调用
labs-leanstral-2603API 端点,目前为限时免费开放,非常适合集成到自动化工作流或开发自定义应用。 - 本地部署 (高级用户): 从官方渠道下载 Apache 2.0 许可的模型权重,在自己的硬件上运行,确保最高级别的数据隐私和控制权。
- 最佳实践: 结合
lean-lsp-mcp工具使用,可获得最佳性能,适用于形式化数学证明、高可信软件验证等场景。
Leanstral 项目官方入口
- 项目官网: https://mistral.ai/news/leanstral
Leanstral 与同类竞品对比分析
| 对比维度 | 模型 | 规模 | FLTEval得分 | 成本 | 特点 |
|---|---|---|---|---|---|
| Leanstral | Leanstral-120B-A6B | 120B/6B | 26.3 (pass@2) 29.3 (pass@4) 31.9 (pass@16) | $18-$290 | 专为Lean 4优化,开源,MCP扩展 |
| 开源竞品 | Qwen3.5-397B-A17B | 397B/17B | 25.4 (pass@4) | – | 需4轮才能达到Leanstral 2轮效果 |
| Kimi-K2.5-1T-A32B | 1T/32B | 20.1 (pass@4) | – | 规模巨大但得分瓶颈明显 | |
| GLM5-744B-A40B | 744B/40B | 16.6 (pass@4) | – | 参数最大但性能最差 | |
| 闭源竞品 | Claude Opus 4.6 | – | 39.6 | $1,650 | 质量最高但成本是Leanstral 92倍 |
| Claude Sonnet 4.6 | – | 23.7 | $549 | 成本是Leanstral 15倍,得分更低 | |
| Claude Haiku 4.5 | – | 23.0 | $184 | 性价比平庸 |
Leanstral 的应用领域
- 形式化数学证明: 在费马大定理等大型数学项目中,Leanstral 能够自动完成复杂的证明,并协助定义新的数学概念。
- 高可信软件验证: 对于 Rust 等编程语言的代码片段,Leanstral 可以验证其严格属性,确保关键任务系统的软件正确性。
- 代码库迁移适配: 针对 Lean 版本升级带来的破坏性变更,Leanstral 能够诊断问题并提供修复方案,例如自动识别
def与abbrev在类型别名中的差异并进行修复。 - 跨语言代码转换: Leanstral 可将 Rocq/Coq 等其他证明语言的代码完整转换为 Lean 4,并保留原有的符号表示和逻辑结构。
- 智能调试诊断: 该模型能够深入分析编译失败的根本原因,自动生成测试用例来复现问题,并提供精确的修复方案及原理说明。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...


粤公网安备 44011502001135号