标签:视频
北大视频大模型新SOTA,搞笑抖音视频AI秒懂笑点|开源
梦晨 发自 凹非寺量子位 | 公众号 QbitAIAI能理解搞笑视频笑点在哪里了。AI回答:这个视频之所以搞笑,在于一个小宝宝正坐在床上努力读书,但他显然还不会真...
Meta生成式AI连放大招:视频生成超越Gen-2,动图表情包随心定制
机器之心报道编辑:张倩、陈萍生成式 AI 进入视频时代了。提到视频生成,很多人首先想到的可能是 Gen-2、Pika Labs。但刚刚,Meta 宣布,他们的视频生成效果...
媲美Gen-2,Meta多模态创AI生图新里程碑!破文生视频历史难题,静图秒变视频逼真到炸裂
新智元报道编辑:编辑部【新智元导读】文生视频,直接被革命了!Meta连发两个重磅研究,多模态模型Emu的变体 Emu Video和Emu Edit联动解锁生成式AI未来。就在...
当韩国女团BLACKPINK进军二次元,清华叉院AI神器原来还能这么玩
机器之心报道编辑:张倩看看这个 AI 生成的女团 MV 效果如何。如果你手机里有一些修图软件,你可能用过里面的「AI 绘画」功能,它通常会提供一些把照片转换为...
微软用GPT-4V解读视频,看懂电影还能讲给盲人听,1小时不是问题
机器之心报道编辑:Panda、陈萍差不多已经掌握语言能力的大模型正在进军视觉领域,但具有里程碑意义的 GPT-4V 也仍有诸多不足之处,参阅《》。近日,微软 Azu...
浙大拿下唯一最佳论文奖,中国团队喜获三项大奖!ACM MultiMedia 2023奖项揭幕
新智元报道编辑:LRS【新智元导读】ACM MM 2023上中国团队获三项大奖,多媒体领域再获新突破。近日,2023 ACM MultiMedia会议落下帷幕,中国大陆团队在这次国...
多媒体顶会ACM Multimedia 2023各大奖项揭晓!浙大获最佳论文,昆士兰获最佳学生论文
【导读】第31届ACM国际多媒体会议(ACM MM)于2023年10月29日至11月2日加拿大渥太华举行。最佳论文,最佳学生论文,最佳demo, 最佳开源软件在内的所有多媒体...
Runway新功能「笔刷」再次惊艳AI圈:随手一涂,图片就动起来了
机器之心报道编辑:蛋酱网友:我都不敢想象一年后的视频技术会有多先进。一段五十秒的预告视频,再次让 AI 圈沸腾了。昨日 Runway 宣布,即将在视频生成工具 ...
Runway 最强竞品 Pika 1.0 预告来袭!文生视频效果堪比迪士尼动画!重新定义动画生成新范式!
夕小瑶科技说 原创作者 |张雨霏、王二狗Runway是AI生成视频赛道的绝对霸主吗?不一定!就在这两天天,Pika在推特上官宣——Pika 1.0即将来袭!话不多说,我们直...
图像涂哪就动哪!Gen-2新功能“神笔马良”爆火,网友:急急急
萧箫 发自 凹非寺量子位 | 公众号 QbitAIAI搞视频生成,已经进化到这个程度了?!对着一张照片随手一刷,就能让被选中的目标动起来!明明是一辆静止的卡车,...
“让霉霉中文开口跪”的AI有开源平替了!每月立省350(doge)
丰色 发自 凹非寺量子位|公众号QbitAI能、的那个AI——有开源平替了!这是用它让罗翔进行英文普法的效果,张三李四“要素齐全”:以及英文讲人生哲理“你的内心有...
百度网盘变了!进化成学习神器:音视频转文稿、加字幕,还能一键生成PPT!
金磊 发自 凹非寺量子位 | 公众号 QbitAI你绝对想不到现在最fashion的学习“姿势”是什么——百度网盘!你以为只是拿它用来存储课件、资料吗?不不不,现在的百度...
用语言对齐多模态信息,北大腾讯等提出LanguageBind,刷新多个榜单
机器之心专栏机器之心编辑部北京大学与腾讯等机构的研究者们提出了多模态对齐框架 ——LanguageBind。该框架在视频、音频、文本、深度图和热图像等五种不同模态...
AI的尽头是美女,一句话生成你的专属“新垣结衣”,“我被美女包围”变为现实啦
这两天你有没有被steam一款游戏刷屏《完蛋!我被美女包围了》《完蛋!我被美女包围了》中的六位女主角在游戏中,玩家将扮演因创业失败负债累累的“普男”,在到...
10分钟定制一个「陈天奇GPT」,OpenAI新品实测来袭!Sam Altman降维打击,千家AI初创公司入土
新智元报道编辑:编辑部【新智元导读】OpenAI引爆了核弹,让任何人都可以使用自然语言在几分钟内构建应用程序!爆炸性的革命时刻,真的来了。OpenAI首届春晚...