标签:多模态学习

MoE++

MoE++是一种新型的混合专家(Mixture-of-Experts)架构,由昆仑万维2050研究院与北大袁粒团队联合推出。基于引入零计算量专家,即零专家、复制专家和常数专家...
阅读原文

DuoAttention

DuoAttention是新型的框架,由MIT韩松团队提出,用在提高大型语言模型(LLMs)在处理长上下文时的推理效率。基于区分“检索头”和“流式头”两种注意力头,优化模...
阅读原文

DriveDreamer4D

DriveDreamer4D是用在提升自动驾驶场景4D重建质量的框架,基于世界模型先验增强4D驾驶场景的表示。框架能基于真实世界的驾驶数据合成新的轨迹视频,用明确结...
阅读原文

MMBench-Video

MMBench-Video是新颖的长视频多题问答基准测试,是浙江大学、上海人工智能实验室、上海交通大学和香港中文大学联合推出的。MMBench-Video能全面评估大型视觉...
阅读原文

MotionCLR

MotionCLR是基于注意力机制的人体动作生成和编辑模型,能根据文本提示生成动作,支持用户进行交互式编辑,如动作强调、减弱、替换、擦除和风格转移。MotionCL...
阅读原文

灵图AI

灵图AI是由厦门灵图科技推出的AI辅助设计平台,专为设计创作人群服务。基于AI算法,提供场景化的高效工具和资源,实现素材生成和设计生产力的提升。平台功能...
阅读原文

Anifusion

Anifusion是在线AI漫画和动漫图片制作平台,通过人工智能技术,让创作者无需绘画技能也能制作出专业级别的漫画和动漫艺术作品。用户只需输入描述性提示,AI能...
阅读原文
123