标签:图文

比 Sora DiT 架构早两个月的 U-ViT,由这家中国 AIGC 公司提出

CVPR2023 曾拒稿 OpeanAI 的 DiT,收录生数科技的 U-ViT。作者丨王悦 编辑丨陈彩娴 「Sora 出来之后,团队就开始连轴转,没休息过。」这是 AI 科技评论了解到...
阅读原文

最强开源多模态生成模型MM-Interleaved:首创特征同步器

机器之心专栏 机器之心编辑部过去几个月中,随着 GPT-4V、DALL-E 3、Gemini 等重磅工作的相继推出,「AGI 的下一步」—— 多模态生成大模型迅速成为全球学者瞩...
阅读原文

图文并茂,三步速出「原神」文稿!首个70亿参数图文混合创作大模型正式开源,一键生成神作

新智元报道编辑:桃子 好困【新智元导读】AI动嘴的时代,创意文稿谁还用手写。上海人工智能实验室推出了首个图文混合创作大模型「书生·浦语灵笔」,三步就能...
阅读原文

新多模态大模型霸榜!支持图文混合输入,不懂知识还能现学

克雷西 发自 凹非寺量子位 | 公众号 QbitAI多模态大模型家族,又有新成员了!不仅能将多张图像与文本结合分析,还能处理视频中的时空关系。这款免费开源的模...
阅读原文