用语言对齐多模态信息，北大腾讯等提出LanguageBind，刷新多个榜单

AIGC动态2年前 (2023)发布机器之心

AIGC动态欢迎阅读

原标题：用语言对齐多模态信息，北大腾讯等提出LanguageBind，刷新多个榜单

关键字：腾讯,数据,语言,语义,视频

文章来源：机器之心

内容字数：6505字

内容摘要：机器之心专栏机器之心编辑部北京大学与腾讯等机构的研究者们提出了多模态对齐框架 ——LanguageBind。该框架在视频、音频、文本、深度图和热图像等五种不同模态的下游任务中取得了卓越的性能，刷榜多项评估榜单，这标志着多模态学习领域向着「大一统」理念迈进了重要一步。在现代社会，信息传递和交流不再局限于单一模态。我们生活在一个多模态的世界里，声音、视频、文字和深度图等模态信息相互交织，共同构成了我们…

原文链接：点此阅读原文：用语言对齐多模态信息，北大腾讯等提出LanguageBind，刷新多个榜单