Leanstral

AI工具3小时前更新 AI工具集
2 0 0

Leanstral – Mistral AI推出的首个开源AI代码智能体

Mistral AI 隆重推出 Leanstral,这款开创性的开源 AI 代码智能体,专为 Lean 4 定理证明器量身打造,标志着 AI 在形式化验证领域迈出了重要一步。

Leanstral:AI 赋能的 Lean 4 专家

Leanstral 是一款集成了先进稀疏专家混合(MoE)架构的 AI 模型,拥有 1200 亿总参数和 60 亿激活参数。它被设计用来自动化 Lean 4 证明过程,显著提升代码的生成效率和准确性。与市场上动辄数千亿甚至万亿参数的巨型模型相比,Leanstral 以其精巧的架构实现了令人瞩目的性能提升,并且成本效益极高,单次任务执行仅需 18 美元。在真实的数学代码库,例如著名的费马大定理项目等评测中,Leanstral 展现了卓越的实力。此外,该模型还具备通过 MCP 协议进行扩展的能力,并已无缝集成到 Mistral Vibe 平台中。

Leanstral 的核心能力

  • 自动化形式化证明生成: Leanstral 能够为 Lean 4 证明助手自动生成严谨的数学证明和软件规范验证代码,极大地简化了形式化过程。
  • 代码正确性严苛验证: 借助 Lean 4 强大的完备验证器,Leanstral 确保生成的代码完全符合严格的形式化规范,有效克服了传统人工审查的瓶颈。
  • 智能诊断与精准修复: 该模型具备分析代码失败原因的能力,例如能够区分 defabbrev 在类型别名中的细微差别,并提供精准的修复建议。
  • 跨语言代码转换: Leanstral 支持将其他证明语言(如 Rocq/Coq)的代码自动转换为 Lean 4 格式,同时保留原有的自定义符号表示,实现无缝迁移。
  • 定理证明的强大助力: 在真实的数学项目(如费马大定理项目)中,Leanstral 能够完成复杂的形式化证明,并协助定义全新的数学概念。

Leanstral 的关键亮点与使用前提

  • 开发者: Mistral AI
  • 定位: 首个专门为 Lean 4 设计的开源 AI 代码智能体
  • 架构: 稀疏专家混合(MoE),120B 总参数 / 6B 激活参数
  • 许可: Apache 2.0(完全开源)
  • 成本: 单次任务仅需 18 美元,pass@2 成本仅为 36 美元(相较于 Claude Sonnet 的 549 美元,极具优势)
  • 性能: 在 FLTEval 评测中获得 29.3 的 pass@4 分数,表现优于大多数同类开源模型
  • Mistral Vibe 集成: 零配置即可使用,只需在对话框中输入 /leanstall
  • Labs API: 提供限时免费的 labs-leanstral-2603 端点
  • 本地部署: 用户可自行下载开源权重,在本地环境中运行,实现完全的数据隐私与控制

Leanstral 的卓越优势

  • 极致效率: 仅需 60 亿激活参数,便能实现超越千亿级参数模型的性能,在性能和成本之间达到完美平衡。
  • 成本效益: 以单次任务 18 美元的低廉价格,提供优于 Claude Sonnet 的验证效果,成本仅为其 1/15。
  • 完全开源: 基于 Apache 2.0 协议开放权重,用户无需担心供应商锁定,支持私有化部署和自主可控。
  • 专注领域优化: 针对 Lean 4 证明工程进行深度训练,在真实数学代码库中的表现远超通用大模型。
  • 可信验证保障: 生成的代码附带形式化数学证明,将人工审查的耗时耗力转变为机器自动验证的高效模式。
  • 生态兼容性强: 原生支持 MCP 协议,能够轻松集成到现有的开发工具链和语言服务器中。

如何体验 Leanstral

  • Mistral Vibe (新手推荐): 访问 Mistral Vibe 平台,在对话框中输入 /leanstall 命令,即可无需任何配置启动 Leanstral。
  • Labs API (开发者首选): 调用 labs-leanstral-2603 API 端点,目前为限时免费开放,非常适合集成到自动化工作流或开发自定义应用。
  • 本地部署 (高级用户): 从官方渠道下载 Apache 2.0 许可的模型权重,在自己的硬件上运行,确保最高级别的数据隐私和控制权。
  • 最佳实践: 结合 lean-lsp-mcp 工具使用,可获得最佳性能,适用于形式化数学证明、高可信软件验证等场景。

Leanstral 项目官方入口

  • 项目官网: https://mistral.ai/news/leanstral

Leanstral 与同类竞品对比分析

对比维度模型规模FLTEval得分成本特点
LeanstralLeanstral-120B-A6B120B/6B26.3 (pass@2)
29.3 (pass@4)
31.9 (pass@16)
$18-$290专为Lean 4优化,开源,MCP扩展
开源竞品Qwen3.5-397B-A17B397B/17B25.4 (pass@4)需4轮才能达到Leanstral 2轮效果
Kimi-K2.5-1T-A32B1T/32B20.1 (pass@4)规模巨大但得分瓶颈明显
GLM5-744B-A40B744B/40B16.6 (pass@4)参数最大但性能最差
闭源竞品Claude Opus 4.639.6$1,650质量最高但成本是Leanstral 92倍
Claude Sonnet 4.623.7$549成本是Leanstral 15倍,得分更低
Claude Haiku 4.523.0$184性价比平庸

Leanstral 的应用领域

  • 形式化数学证明: 在费马大定理等大型数学项目中,Leanstral 能够自动完成复杂的证明,并协助定义新的数学概念。
  • 高可信软件验证: 对于 Rust 等编程语言的代码片段,Leanstral 可以验证其严格属性,确保关键任务系统的软件正确性。
  • 代码库迁移适配: 针对 Lean 版本升级带来的破坏性变更,Leanstral 能够诊断问题并提供修复方案,例如自动识别 defabbrev 在类型别名中的差异并进行修复。
  • 跨语言代码转换: Leanstral 可将 Rocq/Coq 等其他证明语言的代码完整转换为 Lean 4,并保留原有的符号表示和逻辑结构。
  • 智能调试诊断: 该模型能够深入分析编译失败的根本原因,自动生成测试用例来复现问题,并提供精确的修复方案及原理说明。
阅读原文
© 版权声明
蝉镜AI数字人

相关文章

蝉镜AI数字人

暂无评论

暂无评论...