标签:视频

将Transformer用于扩散模型,AI 生成视频达到照片级真实感

机器之心报道编辑:Panda在视频生成场景中,用 Transformer 做扩散模型的去噪骨干已经被李飞飞等研究者证明行得通。这可算得上是 Transformer 在视频生成领域...
阅读原文

拳打Pika脚踢Gen-2!斯坦福李飞飞联合谷歌,AI文生视频大模型炸圈

文生视频工具扎堆爆发,视频的GPT时刻来了?作者|李水青编辑|漠影AI文生视频赛道正呈现出爆发之势!继本月AI文生视频工具Pika 1.0爆火出圈、Gen-2效果大升级...
阅读原文

李飞飞谷歌破局之作!用Transformer生成逼真视频,下一个Pika来了?

新智元报道编辑:Aeneas 润【新智元导读】今天,李飞飞携斯坦福联袂谷歌,用Transformer生成了逼真视频,效果媲美Gen-2比肩Pika。2023年俨然已成AI视频元年!...
阅读原文

Runway官宣下场通用世界模型!解决视频AI最大难题,竟靠AI模拟世界?

新智元报道编辑:编辑部【新智元导读】Runway突然发布公告,宣称要开发通用世界模型,解决AI视频最大难题,未来要用AI模拟世界。最近AI视频赛道的Pika 1.0大...
阅读原文

阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!

金磊 发自 凹非寺量子位 | 公众号 QbitAI继AnimateAnyone之后,阿里又一项“舞蹈整活儿”论文火了——这一次,只需一张脸部照片、一句话描述,就能让你在任何地方...
阅读原文

被高估的Pika,被低估的多模态AI|甲子光年

如何打通物理世界和数字世界之间的屏障?作者|苏霍伊编辑|王博‍‍多模态 AI 正处于爆发前夜。从 GPT-4V 的“惊艳亮相”,到 AI 视频生成工具 Pika 1.0 的“火爆...
阅读原文

阿里Animate Anyone跳舞火了,作者带你解读背后技术

从 GAN 开始,研究者一直在不断深入了解将图像进行动画化以及进行姿态迁移的探索,然而,生成的图像或视频仍然存在局部失真、细节模糊、语义不一致和时间不稳...
阅读原文

AI变鉴片大师,星际穿越都能看懂!贾佳亚团队新作,多模态大模型挑战超长3小时视频

丰色 明敏 发自 凹非寺量子位 | 公众号 QbitAI啥?AI都能自己看电影大片了?贾佳亚团队最新研究成果,让大模型直接学会了处理超长视频。丢给它一部科幻大片《...
阅读原文

谷歌承认Gemini视频是“剪出来”的,想赶超GPT-4想疯了

夕小瑶科技说 原创作者 | 付奶茶、王二狗大家好,我是奶茶。前天谷歌DeepMind新发布的Gemini模型刷屏了,大家是不是也和奶茶一样被Gemini的效果震撼到了。觉...
阅读原文

Pika 1.0首测秒杀Gen-2!网友抢先体验电影级炸裂效果,背后技术细节首公开

新智元报道编辑:桃子【新智元导读】Pika 1.0首测开启了!网友抢先体验,每个视频都是经典。Pika 1.0正式上线后,拿到内测资格的网友们已经玩疯了!有人用它...
阅读原文

再反转!谷歌Gemini又曝猛料,逐帧分析揭开复仇GPT-4的底牌

谷歌Gemini没宣传视频里那么牛,但硬刚GPT-4够了?作者|李水青编辑|云鹏在刚刚过去的24小时里,谷歌Gemini的一段演示视频爆火全球。像机器人贾维斯一样,谷歌...
阅读原文

Gemini 解读:原生多模态,反倒证明了文本对于大模型的重要性

谷歌在 12 月 6 日发布了 Gemini 语言大模型,并在 Bard 中上线了 Gemini Pro 版本。谷歌同时在官网发布了 Gemini 的详细技术报告(),对于 Gemini 的训练原...
阅读原文

谷歌Gemini被曝视频造假!多模态视频竟是剪辑配音,击败GPT-4靠「作弊」?

新智元报道编辑:编辑部【新智元导读】才一天,谷歌Gemini被质疑造假、夸大宣传的议论声淹没了。多模态视频是剪辑拼贴的,打败GPT-4靠的是CoT@32,AlphaGo也...
阅读原文

Gemini上线首日:用户褒贬不一,演示被质疑「造假」,谷歌承认了

机器之心报道编辑:泽南、杜伟、陈萍又不求融资,怎么也给 demo 加美颜?「谷歌,这就有点尴尬了。」没有想到,Gemini 上线头一天,热门评论会是这个样子。本...
阅读原文

口碑翻转,Pika 1.0试用效果折服一大票人,直呼「最佳视频生成器」

机器之心报道编辑:杜伟从陆续放出的 Pika 1.0 生成视频来看,这次 Runway 真的迎来了一个强劲的竞争对手。上个月底,一个名为 的视频生成 AI 模型在社交媒...
阅读原文
1464748495054