Ornith-1.0

AI工具24分钟前更新 AI工具集
0 0 0

Ornith-1.0 – DeepReinforce 开源的 Agentic 编程系列模型

Ornith-1.0:Agentic 编程的革新力量

由 DeepReinforce 团队倾力打造的 Ornith-1.0 系列开源大模型,正以前所未有的姿态,引领 Agentic 编程新纪元。该系列模型以 Gemma 4 和 Qwen 3.5 为坚实基座,辅以开创性的自改进训练框架,在代码生成及软件工程领域,已然攀登至同级别开源模型的顶峰。

Ornith-1.0 的独特之处

  • 全方位规格,满足多元需求:Ornith-1.0 提供 9B Dense、31B Dense、35B MoE 和 397B MoE 四种规格,从轻量级边缘设备到性能卓绝的旗舰级服务器,都能找到完美适配的部署方案。
  • Agentic 编程的专属优化:专为智能体编程任务量身定制,Ornith-1.0 能够高效解决复杂软件工程难题,如代码缺陷的精准修复、新功能的智能实现,乃至终端命令的自动化执行。
  • 自驱动的脚手架生成能力:该模型具备生成任务专属脚手架(harness)的独特本领,能够自主探寻并优化解决方案的搜索路径,极大地提升了自动化编程的效率。
  • 本地部署的便捷性:已全面上线 HuggingFace,并提供兼容 OpenAI API 的接口,同时支持多种灵活的本地部署方式,让强大的 AI 能力触手可及。

Ornith-1.0 的技术内核

  • 强大的基座模型支撑:模型在 Gemma 4 和 Qwen 3.5 强大的预训练权重基础上进行精细调优,完美继承了它们卓越的语言理解和代码生成能力。
  • 革新的自改进训练框架:与传统依赖人工设计脚手架的强化学习方法不同,Ornith-1.0 创新性地采用强化学习,让模型能够同时生成解决方案展开(rollout)和任务特定的脚手架,实现两者协同进化。
  • 精妙的联合优化机制:在训练过程中,模型同时优化任务脚手架和最终生成结果,赋能模型自主发现更优的探索轨迹,从而持续不断地提升输出的质量和可靠性。

如何驾驭 Ornith-1.0

  • 获取模型:前往 HuggingFace 平台,搜索 Ornith-1.0 系列,轻松下载您所需的模型权重。
  • 本地部署:根据您的硬件条件,选择 9B(适用于边缘设备)、31B/35B 或 397B 版本进行本地部署。
  • 无缝接口调用:利用兼容 OpenAI API 的接口,将其轻松集成到您现有的开发工作流或 Agent 框架中。
  • 场景化任务配置:针对 Agentic coding 场景,可将模型嵌入 IDE 插件或自动化软件工程流水线,释放其强大潜能。

Ornith-1.0 的核心竞争力

  • 同级领先的性能表现:旗舰版 397B 在 Terminal-Bench 2.1 上斩获 77.5 分,在 SWE-Bench Verified 上取得 82.4 分,超越了 Claude Opus 4.7。
  • 越级挑战的卓越实力:35B MoE 版本在 Terminal-Bench 2.1 上以 64.4 分的成绩,力压参数量更大的 Qwen 3.5-397B(53.5 分),展现了“以小博大”的非凡能力。
  • 边缘部署的友好之选:9B 模型在低资源环境下也能流畅运行,其性能足以媲美 Gemma 4-31B 和 Qwen 3.6 35B。

Ornith-1.0 的项目入口

Ornith-1.0 与同类竞品比较

对比维度Ornith-1.0DeepSeek-V4-Pro
参数规模9B / 31B Dense、35B / 397B MoE(全系列梯度覆盖)超大参数(具体规格未公开细分梯度)
开源协议MIT(完全开源,可商用)开源(具体协议以官方为准)
Terminal-Bench 2.177.5(397B)/ 64.4(35B)67.9
SWE-Bench Verified82.4(397B)80.6
核心训练方法自改进训练框架:模型自主生成任务脚手架(harness)并与解决方案联合优化,减少人工设计依赖RLHF + 规则驱动优化:依赖人类反馈与预设规则进行代码优化
模型定位Agentic 编程专用:专为智能体编程、终端命令执行、软件工程自动化设计通用编程开源:面向广泛代码生成与编程辅助任务
部署灵活性全规格覆盖:9B 可部署至边缘设备,397B 面向服务器集群主要聚焦超大参数版本,边缘部署受限

Ornith-1.0 的应用前景

  • 智能体编程的得力助手:作为 AI 程序员的核心引擎,自动化处理 GitHub Issue 修复、代码审查及功能开发等繁琐任务。
  • 终端命令的智能执行者:基于 Terminal-Bench 优化能力,高效执行复杂的服务器运维、数据分析及自动化脚本任务。
  • 边缘设备的智能代码伙伴:9B 版本可嵌入本地 IDE 插件或离线开发环境,为资源受限场景提供实时的代码补全与辅助。
  • 企业级软件工程的强大支撑:397B 旗舰版可应用于大型代码库维护、跨文件重构及复杂软件架构的设计与优化。
阅读原文
© 版权声明

相关文章

AI聚合视觉工厂

暂无评论

暂无评论...