AI项目和框架
Gemini Embedding 2
Gemini Embedding 2 是谷歌首个原生多模态嵌入模型,基于 Gemini 架构构建。模型将文本、图像、视频、音频和文档统一映射到同一向量空间,支持跨 100 多种语...
SongGeneration 2
SongGeneration 2是腾讯与清华大学联合开源的4B参数音乐生成大模型,采用混合LLM-扩散架构与分层表征设计,实现商业级音乐生成质量。模型歌词准确率达8.55% P...
Mobile-Agent-v3.5
Mobile-Agent-v3.5 是阿里巴巴通义实验室开源的新一代多平台GUI Agent框架,标志着开源GUI智能体从"演示级"迈向"工程可用级"。框架原生...
Yuan3.0 Ultra
Yuan3.0-Ultra 是浪潮信息YuanLab.ai团队开源的万亿参数多模态基础大模型,总参数 1.01T,激活参数 68.8B。采用 MoE 架构,集成视觉编码器与多模态对齐模块,...
Phi-4-reasoning-vision-15B
Phi-4-reasoning-vision-15B是微软开源的150亿参数多模态推理模型,基于Phi-4-Reasoning语言模型和SigLIP-2视觉编码器构建。
MiniMax Music 2.5+
MiniMax Music 2.5+是MiniMax推出的AI音乐生成模型,主打纯音乐创作能力。模型支持古典管弦、电子、氛围音等多元风格,覆盖冥想、助眠、游戏、影视等全场景。