AI项目和框架

Fun-CineForge

Fun-CineForge是通义实验室开源的首个影视级多模态配音大模型,基于CosyVoice3构建,创新引入"时间模态"实现精准音画同步。模型支持独白、旁白、对...
阅读原文

OpenMAIC

OpenMAIC是清华团队开源的多智能体AI课堂平台,能将任意主题或文档一键转化为沉浸式交互课程。平台支持AI教师语音授课、AI同学举手讨论、白板实时绘图,可生...
阅读原文

GLM-5-Turbo

GLM-5-Turbo(代号:Pony-Alpha-2)是智谱AI推出的面向OpenClaw(龙虾)Agent场景深度优化的基座模型。模型从训练阶段就针对工具调用、复杂指令遵循、定时与...
阅读原文

OpenJarvis

OpenJarvis 是斯坦福大学 Scaling Intelligence Lab 推出的开源本地 AI 智能体框架,核心理念是让 AI 执行完全本地化,将云端调用作为可选项。框架提供统一的...
阅读原文

Paperclip

Paperclip 是开源的AI Agent编排平台,支持用户把多个 AI Agent(如 OpenClaw、Claude、Cursor)组织成一家真正的"赛博公司"。平台提供完整的企业...
阅读原文

Clawith

Clawith是面向企业的开源混合多智能体协作框架,将AI Agent视为"数字员工"非简单聊天工具。每个Agent拥有持久身份(soul.md)、长期记忆(memory.m...
阅读原文

Kairos 3.0-4B

Kairos 3.0-4B是大晓机器人开源的具身原生世界模型,首创"多模态理解—生成—预测"一体化架构。作为全球首个可端侧驱动机器人本体控制的4B轻量模型,...
阅读原文

Solaris

Solaris是首个多人视频世界生成模型,能在Minecraft中同时生成两个玩家一致的第一人称视角。模型突破现有模型仅支持单玩家的局限,确保跨玩家视角的空间一致...
阅读原文

InternVL-U

InternVL-U是上海人工智能实验室联合多所顶尖高校开源的4B参数轻量化统一多模态模型,首次实现"理解—推理—生成—编辑"端到端闭环。模型采用"统...
阅读原文

StepClaw

StepClaw是阶跃AI推出的云端智能助手,基于OpenClaw架构推出。用户可通过阶跃AI APP快速完成云端部署,省去本地硬件配置烦恼。
阅读原文

LTX-2.3

LTX-2.3 是以色列 AI 公司 Lightricks 开源的最新一代视频生成模型,采用 Diffusion Transformer 架构,拥有 220 亿参数。模型支持文本、图像、音频三种输入...
阅读原文

Nemotron 3 Super

Nemotron 3 Super是英伟达推出的1200亿参数开源AI模型,采用Mamba-MoE混合架构,专为智能体应用优化。模型支持100万token超长上下文,推理速度提升3倍,吞吐...
阅读原文

CLI-Anything

CLI-Anything 是香港大学数据科学实验室(HKUDS)开源的工具,能将任意开源软件的代码库一键转化为 AI Agent 可用的命令行接口(CLI)。
阅读原文

Gemini Embedding 2

Gemini Embedding 2 是谷歌首个原生多模态嵌入模型,基于 Gemini 架构构建。模型将文本、图像、视频、音频和文档统一映射到同一向量空间,支持跨 100 多种语...
阅读原文

SongGeneration 2

SongGeneration 2是腾讯与清华大学联合开源的4B参数音乐生成大模型,采用混合LLM-扩散架构与分层表征设计,实现商业级音乐生成质量。模型歌词准确率达8.55% P...
阅读原文
12345178