AI项目和框架

Qoder Rules

Qoder Rules 是开源的完整代码规范和模板系统,能帮助开发者使用 Qoder 进行更高效、规范的开发。Qoder Rules 遵循阿里云 AI 架构和最佳实践,涵盖开发需求、...
阅读原文

Doubao-Seed-Code

Doubao-Seed-Code 是字节跳动推出的 AI 编程模型,专为 Agentic 编程任务优化。模型支持 256K 长上下文,可处理复杂代码场景,具备视觉理解能力,能根据设计...
阅读原文

Omnilingual ASR

Omnilingual ASR 是 Meta AI 推出的自动语音识别系统,支持超过1600种语言,包括500种低资源语言。Omnilingual ASR通过扩展 wav2vec 2.0 编码器到70亿参数,...
阅读原文

DeepEyesV2

DeepEyesV2 是小红书团队推出的多模态智能体模型,通过两阶段训练法实现强大的工具调用和多模态推理能力。模型能理解图文信息,支持主动调用代码执行、网络搜...
阅读原文

SenseNova-SI

SenseNova-SI 是商汤开源的空间智能大模型,专注于提升空间智能。模型通过大规模、高质量的空间数据训练,显著增强模型在空间测量、关系理解、视角转换等核心...
阅读原文

Frappe Builder

Frappe Builder 是低代码网站构建AI工具,帮助用户轻松创建和发布美观的网站。通过直观的可视化编辑器,提供类似 Figma 的设计体验,让用户能快速搭建网页布...
阅读原文

NocoBase

NocoBase 是开源、数据优先的AI无代码或低代码平台。以微内核+插件化为核心,所有功能(权限、工作流、API、主题等)均可按需插拔,支持 Node.js 与主流数据...
阅读原文

SuitAgent

SuitAgent 是基于 Claude Code 架构的诉讼法律服务智能分析框架,由 10 个专业 AI Agents协作,将复杂诉讼案件分解为多个可独立执行的工作流,实现法律文书的...
阅读原文

文心 5.0 Preview

文心 5.0 Preview (ERNIE-5.0-Preview)是百度最新推出的人工智能大语言模型。模型在 LMArena 文本竞技场(Text Arena)排名中位居全球并列第二、国内第一,...
阅读原文

Maya1

Maya1 是 Maya Research 团队推出的开源语音模型,专为生成富有情感的语音而设计。模型通过自然语言描述来设计声音,支持 20 多种情绪表达,如大笑、哭泣、叹...
阅读原文

Step-Audio-EditX

Step-Audio-EditX 是阶跃星辰开源的全球首个 LLM 级音频编辑大模型,主打“情感、说话风格、副语言”三轴细粒度迭代控制,可把愤怒、开心、悲伤等情绪强度任意...
阅读原文

Kimi-k2 Thinking

Kimi-k2 Thinking 是月之暗面推出的具备通用 Agentic 能力和深度推理能力的人工智能模型。模型能进行多轮工具调用,支持长达 256k 的上下文处理,适合复杂任...
阅读原文

Open-o3 Video

Open-o3 Video 是北京大学和字节跳动联合开发的开源视频推理模型,通过整合显式的时空证据(关键时间戳和边界框)来实现精准的视频推理。通过精心策划的 STGR...
阅读原文

OmniVinci

OmniVinci是NVIDIA推出的全模态大语言模型,专门处理视觉、听觉、语言和推理的多模态任务。通过独特的OmnialignNet技术实现跨模态语义对齐,Temporal Embeddi...
阅读原文

UNO-Bench

UNO-Bench是美团LongCat团队推出的全模态大模型评测基准。UNO-Bench针对现有评测体系的不足,通过高质量、多样化的数据构建,精准衡量模型的单模态与全模态能...
阅读原文