AI项目和框架
Voxtral Transcribe 2
Voxtral Transcribe 2 是 Mistral AI 推出的新一代系列语音转文本模型,包含两个版本:Voxtral Mini Transcribe V2 专注批量转录,支持13种语言、说话人分离...
MiniCPM-o 4.5
MiniCPM-o 4.5 是面壁智能开源的 9B 参数全模态旗舰模型,采用端到端架构融合 SigLip2、Whisper、CosyVoice2 与 Qwen3-8B。
ACE-Step 1.5
ACE-Step 1.5是ACE Studio与StepFun联合推出的开源音乐生成基础模型,能在消费级硬件上实现商业级音乐生成。模型采用混合架构,语言模型作为规划器将用户提示...
SoulX-FlashTalk
SoulX-FlashTalk 是 Soul App 旗下 AI 团队开源的首个 14B 参数实时数字人生成模型,实现了 0.87 秒亚秒级延迟和 32fps 高帧率。
Qwen3-Coder-Next
Qwen3-Coder-Next 是阿里 Qwen 团队开源的编程智能体模型,采用混合专家(MoE)架构,总参数 80B 每次推理仅激活 3B,大幅降低显存与算力成本。
Step 3.5 Flash
Step 3.5 Flash 是阶跃星辰最新开源的基座模型,专为 Agent 场景推出。模型采用稀疏 MoE 架构,总参数 1960 亿,每 token 仅激活 110 亿参数,兼顾性能与效率。
粤公网安备 44011502001135号