AI项目和框架
daVinci-MagiHuman
daVinci-MagiHuman 是上海创智学院 GAIR 实验室与 Sand.ai 联合开源的音视频联合生成基座模型。模型采用 150 亿参数的单流 Transformer 架构,统一建模文本、...
LongCat-Next
LongCat-Next是美团LongCat推出的多模态模型,核心创新是LoZA稀疏注意力机制。模型通过智能筛查模块重要性,将50%低重要模块替换为流式稀疏注意力,形成全局...
TurboQuant
TurboQuant 是 Google Research 推出的向量量化算法,可将大模型 KV Cache 从 32-bit 压缩至 3-bit,实现内存降低 6 倍、推理速度提升 8 倍,且精度零损失。
MiniMax Office Skills
MiniMax Office Skills 是稀宇科技开源的一套生产级办公文档引擎。工具包含四个核心组件,MiniMax-docx(Word)、MiniMax-xlsx(Excel)、MiniMax-pdf(PDF)...
DeerFlow 2.0
DeerFlow 2.0 是字节跳动开源的超级智能体框架,采用"主智能体+11层中间件链+动态子智能体"架构,通过LangGraph实现多智能体协同。框架内置深度研...
MAI-Image-2
MAI-Image-2 是微软 AI Superintelligence 团队推出的第二代文生图模型,目前在 Arena.ai 排行榜位列全球前三。模型主打三大核心能力:增强的照片级真实感、...
PrismAudio
PrismAudio 是阿里通义实验室推出的视频生成音频(Video-to-Audio)框架,可为无声视频自动配上环境音效。模型首创"分解式思维链"技术,让模型先思...
SoulX-LiveAct
SoulX-LiveAct 是Soul App AI团队开源的实时数字人生成框架,解决AR扩散模型流式生成的稳定性难题。核心创新包括:Neighbor Forcing技术对齐相邻帧扩散步数确...
粤公网安备 44011502001135号