AI项目和框架

Xiaomi MiMo-V2-TTS

Xiaomi MiMo-V2-TTS 是小米为 Agent 时代推出的语音合成大模型。模型基于自研 Audio Tokenizer 和多码本架构,经上亿小时语音数据预训练与多维度强化学习,实...
阅读原文

Midjourney V8

Midjourney V8 是 Midjourney推出的最新图像生成模型,生成速度较之前提升 5 倍,提示词理解与文本渲染显著改善,支持 2K 高清直出。
阅读原文

MindVLA-o1

MindVLA-o1是理想汽车推出的下一代自动驾驶基础模型,采用原生多模态MoE架构,统一融合视觉、语言、行为三种模态。
阅读原文

MiniMax M2.7

MiniMax M2.7 是稀宇科技推出的新一代AI模型,能自主构建Agent Harness、优化自身训练流程,参与迭代自己。
阅读原文

GPT-5.4 nano

GPT-5.4 nano 是 OpenAI 推出的最轻量、最快速的 GPT-5.4 版本,专为对速度和成本要求极高的简单高吞吐量任务设计。
阅读原文

GPT-5.4 mini

GPT-5.4 mini是OpenAI推出的最强小型模型,专为高吞吐量、低延迟场景设计。模型比前代GPT-5 mini快2倍以上,在编程、推理、多模态理解和计算机使用等任务中性...
阅读原文

Covo-Audio

Covo-Audio 是腾讯开源的70亿参数端到端语音大模型,可直接处理连续音频输入并生成音频输出。模型核心创新包括分层三模态语音-文本交错架构、智能与说话人解...
阅读原文

Leanstral

Leanstral 是Mistral AI推出的首个开源AI代码智能体,专为Lean 4定理证明器设计。模型采用120B总参数/6B激活参数的稀疏架构,能自动生成形式化证明并验证代码...
阅读原文

Mistral Small 4

Mistral Small 4 是 Mistral AI 开源的多模态大模型,模型首次将推理(Magistral)、多模态(Pixtral)和智能体编码(Devstral)能力统一于单一架构,支持文...
阅读原文

NemoClaw

NemoClaw是英伟达开源的企业级AI Agent框架。NemoClaw作为OpenClaw插件运行,通过OpenShell运行时提供安全沙箱和策略引擎,解决企业使用AI Agent的安全顾虑。
阅读原文

AgentScope Java

AgentScope Java是阿里巴巴开源的面向企业级智能体开发的Java框架,让Java开发者能轻松构建生产级AI应用。框架采用领先的ReAct范式,使大模型具备自主推理与...
阅读原文

Fun-CineForge

Fun-CineForge是通义实验室开源的首个影视级多模态配音大模型,基于CosyVoice3构建,创新引入"时间模态"实现精准音画同步。模型支持独白、旁白、对...
阅读原文

OpenMAIC

OpenMAIC是清华团队开源的多智能体AI课堂平台,能将任意主题或文档一键转化为沉浸式交互课程。平台支持AI教师语音授课、AI同学举手讨论、白板实时绘图,可生...
阅读原文

GLM-5-Turbo

GLM-5-Turbo(代号:Pony-Alpha-2)是智谱AI推出的面向OpenClaw(龙虾)Agent场景深度优化的基座模型。模型从训练阶段就针对工具调用、复杂指令遵循、定时与...
阅读原文

OpenJarvis

OpenJarvis 是斯坦福大学 Scaling Intelligence Lab 推出的开源本地 AI 智能体框架,核心理念是让 AI 执行完全本地化,将云端调用作为可选项。框架提供统一的...
阅读原文
1910111213186