Leanstral

Leanstral – Mistral AI推出的首个开源AI代码智能体

Mistral AI 隆重推出 Leanstral，这款开创性的开源 AI 代码智能体，专为 Lean 4 定理证明器量身打造，标志着 AI 在形式化验证领域迈出了重要一步。

Leanstral：AI 赋能的 Lean 4 专家

Leanstral 是一款集成了先进稀疏专家混合（MoE）架构的 AI 模型，拥有 1200 亿总参数和 60 亿激活参数。它被设计用来自动化 Lean 4 证明过程，显著提升代码的生成效率和准确性。与市场上动辄数千亿甚至万亿参数的巨型模型相比，Leanstral 以其精巧的架构实现了令人瞩目的性能提升，并且成本效益极高，单次任务执行仅需 18 美元。在真实的数学代码库，例如著名的费马大定理项目等评测中，Leanstral 展现了卓越的实力。此外，该模型还具备通过 MCP 协议进行扩展的能力，并已无缝集成到 Mistral Vibe 平台中。

Leanstral 的核心能力

自动化形式化证明生成： Leanstral 能够为 Lean 4 证明助手自动生成严谨的数学证明和软件规范验证代码，极大地简化了形式化过程。
代码正确性严苛验证： 借助 Lean 4 强大的完备验证器，Leanstral 确保生成的代码完全符合严格的形式化规范，有效克服了传统人工审查的瓶颈。
智能诊断与精准修复： 该模型具备分析代码失败原因的能力，例如能够区分 def 和 abbrev 在类型别名中的细微差别，并提供精准的修复建议。
跨语言代码转换： Leanstral 支持将其他证明语言（如 Rocq/Coq）的代码自动转换为 Lean 4 格式，同时保留原有的自定义符号表示，实现无缝迁移。
定理证明的强大助力： 在真实的数学项目（如费马大定理项目）中，Leanstral 能够完成复杂的形式化证明，并协助定义全新的数学概念。

Leanstral 的关键亮点与使用前提

开发者： Mistral AI
定位： 首个专门为 Lean 4 设计的开源 AI 代码智能体
架构： 稀疏专家混合（MoE），120B 总参数 / 6B 激活参数
许可： Apache 2.0（完全开源）
成本： 单次任务仅需 18 美元，pass@2 成本仅为 36 美元（相较于 Claude Sonnet 的 549 美元，极具优势）
性能： 在 FLTEval 评测中获得 29.3 的 pass@4 分数，表现优于大多数同类开源模型
Mistral Vibe 集成： 零配置即可使用，只需在对话框中输入 /leanstall
Labs API： 提供限时免费的 labs-leanstral-2603 端点
本地部署： 用户可自行下载开源权重，在本地环境中运行，实现完全的数据隐私与控制

Leanstral 的卓越优势

极致效率： 仅需 60 亿激活参数，便能实现超越千亿级参数模型的性能，在性能和成本之间达到完美平衡。
成本效益： 以单次任务 18 美元的低廉价格，提供优于 Claude Sonnet 的验证效果，成本仅为其 1/15。
完全开源： 基于 Apache 2.0 协议开放权重，用户无需担心供应商锁定，支持私有化部署和自主可控。
专注领域优化： 针对 Lean 4 证明工程进行深度训练，在真实数学代码库中的表现远超通用大模型。
可信验证保障： 生成的代码附带形式化数学证明，将人工审查的耗时耗力转变为机器自动验证的高效模式。
生态兼容性强： 原生支持 MCP 协议，能够轻松集成到现有的开发工具链和语言服务器中。

如何体验 Leanstral

Mistral Vibe (新手推荐)： 访问 Mistral Vibe 平台，在对话框中输入 /leanstall 命令，即可无需任何配置启动 Leanstral。
Labs API (开发者首选)： 调用 labs-leanstral-2603 API 端点，目前为限时免费开放，非常适合集成到自动化工作流或开发自定义应用。
本地部署 (高级用户)： 从官方渠道下载 Apache 2.0 许可的模型权重，在自己的硬件上运行，确保最高级别的数据隐私和控制权。
最佳实践： 结合 lean-lsp-mcp 工具使用，可获得最佳性能，适用于形式化数学证明、高可信软件验证等场景。

Leanstral 项目官方入口

项目官网： https://mistral.ai/news/leanstral

Leanstral 与同类竞品对比分析

对比维度	模型	规模	FLTEval得分	成本	特点
Leanstral	Leanstral-120B-A6B	120B/6B	26.3 (pass@2) 29.3 (pass@4) 31.9 (pass@16)	$18-$290	专为Lean 4优化，开源，MCP扩展
开源竞品	Qwen3.5-397B-A17B	397B/17B	25.4 (pass@4)	–	需4轮才能达到Leanstral 2轮效果
	Kimi-K2.5-1T-A32B	1T/32B	20.1 (pass@4)	–	规模巨大但得分瓶颈明显
	GLM5-744B-A40B	744B/40B	16.6 (pass@4)	–	参数最大但性能最差
闭源竞品	Claude Opus 4.6	–	39.6	$1,650	质量最高但成本是Leanstral 92倍
	Claude Sonnet 4.6	–	23.7	$549	成本是Leanstral 15倍，得分更低
	Claude Haiku 4.5	–	23.0	$184	性价比平庸

Leanstral 的应用领域

形式化数学证明： 在费马大定理等大型数学项目中，Leanstral 能够自动完成复杂的证明，并协助定义新的数学概念。
高可信软件验证： 对于 Rust 等编程语言的代码片段，Leanstral 可以验证其严格属性，确保关键任务系统的软件正确性。
代码库迁移适配： 针对 Lean 版本升级带来的破坏性变更，Leanstral 能够诊断问题并提供修复方案，例如自动识别 def 与 abbrev 在类型别名中的差异并进行修复。
跨语言代码转换： Leanstral 可将 Rocq/Coq 等其他证明语言的代码完整转换为 Lean 4，并保留原有的符号表示和逻辑结构。
智能调试诊断： 该模型能够深入分析编译失败的根本原因，自动生成测试用例来复现问题，并提供精确的修复方案及原理说明。

阅读原文