AI项目和框架

Lyria 3

Lyria 3 是 Google DeepMind 推出的最新一代 AI 音乐生成模型,目前已集成到 Gemini 应用中。与前代相比,Lyria 3 实现了重大突破:用户无需自行撰写歌词,只...
阅读原文

Ming-omni-tts

Ming-omni-tts 是蚂蚁集团开源的统一音频生成模型,采用自回归架构实现语音、音乐和音效的联合生成。模型支持通过自然语言指令对语速、音调、音量、情感和方...
阅读原文

SoulX-Singer

SoulX-Singer 是 Soul App 联合天津大学、西北工业大学开源的工业级零样本歌声合成模型。模型基于 4.2 万小时高质量多语言歌声数据训练,支持 MIDI 乐谱与 F0...
阅读原文

FireRed-Image-Edit

FireRed-Image-Edit是小红书Super Intelligence团队开源的通用图像编辑模型,基于扩散架构,支持文本引导的图像编辑、老照片修复、虚拟试穿等多功能。
阅读原文

Qwen3.5

Qwen3.5是阿里巴巴通义千问团队正式发布并开源的新一代原生多模态大模型。首发开源版本Qwen3.5-397B-A17B采用创新的混合架构,将线性注意力(Gated Delta Net...
阅读原文

MonsterClaw

MonsterClaw 是基于 OpenClaw 内核的本地AI执行系统,完全部署在用户本地计算机上运行,无需将数据上传至云端,从根本上保障隐私安全。安装后,MonsterClaw ...
阅读原文

Xiaomi-Robotics-0

Xiaomi-Robotics-0是小米开源的首代机器人VLA(视觉-语言-动作)大模型,拥有47亿参数,采用MoT混合架构,Qwen3-VL多模态模型作为"大脑"理解视觉语...
阅读原文

Seed2.0

Seed2.0是字节跳动Seed团队推出的最新大模型系列,包含Pro(doubao-seed-2-0-pro-260215)、Lite(doubao-seed-2-0-lite-260215)、Mini(doubao-seed-2-0-mi...
阅读原文

Ring-2.5-1T

Ring-2.5-1T是蚂蚁集团inclusionAI团队开源的万亿参数混合线性思考模型,采用Ling 2.5架构,以1:7比例融合MLA与Lightning Linear注意力机制。
阅读原文

Seedream 5.0 Lite

Seedream 5.0 Lite 是字节跳动 Seed 团队推出的新一代智能图像创作模型。相比Seedream 4.0,模型在理解、推理和生成方面全面提升,采用多模态统一架构,能深...
阅读原文

MiniMax M2.5

M2.5 是MiniMax推出的10B激活参数轻量级旗舰大模型,主打编程与Agentic能力。模型支持100 TPS超高推理速度(约为Claude Opus 3倍),支持 10+ (Go、Rust、Ko...
阅读原文

Gemini 3 Deep Think

Gemini 3 Deep Think 是 Google DeepMind 推出的专用推理模型,主打深度科学推理与复杂问题解决。模型在 ARC-AGI-2 基准达 84.6%,远超同类模型。
阅读原文

GPT‑5.3‑Codex‑Spark

GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的轻量级模型,主打极致速度。模型运行在Cerebras WSE-3晶圆级芯片上,推理速度超1000 tokens/秒,支持128k...
阅读原文

MiniCPM-SALA

MiniCPM-SALA是面壁智能开源的9B端侧大模型,采用创新的SALA(稀疏-线性混合注意力)架构,75%线性注意力负责全局高效建模,用25%稀疏注意力精准捕捉关键信息...
阅读原文

GLM-5

GLM-5是智谱开源的新一代旗舰AI模型,参数规模从GLM-4.5的355B扩展至744B(40B激活),预训练数据达28.5T tokens。模型为此前OpenRouter登顶热度榜首的神秘模...
阅读原文
156789178