标签:视频

翻车,才是斯坦福炒菜机器人学习人类的常态

机器之心报道 作者:大盘鸡、陈萍Mobile ALOHA也有翻车时刻。 电视剧中角色的惊艳亮相不一定能打动你的心,但斯坦福全职管家兼御用大厨一定能拿下你对机器人...
阅读原文

Pika一键生成3秒视频,够做一个表情包

大数据文摘授权转载自AI科技评论 作者:晓龙 省流:Pika是一款文字生成视频的AI模型,可输入文字、上传图片乃至录制视频后再通过AI进一步生成一个新的视频。...
阅读原文

Pika 一键生成 3 秒视频,够做一个表情包

省流:Pika是一款文字生成视频的AI模型,可输入文字、上传图片乃至录制视频后再通过AI进一步生成一个新的视频。在2023年11月,Pika开放端口在Discord进行测试...
阅读原文

AI解读视频张口就来?这种「幻觉」难题Vista-LLaMA给解决了

机器之心专栏 机器之心编辑部Vista-LLaMA 在处理长视频内容方面的显著优势,为视频分析领域带来了新的解决框架。近年来,大型语言模型如 GPT、GLM 和 LLaMA ...
阅读原文

斯坦福爆火机器人失败!炒虾做家务逗猫都是人类遥控的,AI厨师和女仆还很遥远

夕小瑶科技说 原创作者 | 王二狗大家好,我是二狗。 这两天,想必大家都看到了斯坦福华人团队的 ALOHA 机器人爆火网络。 既能炒虾仁滑蛋、干贝烧鸡和耗油生菜...
阅读原文

新加坡国立大学发布图文预训练框架 CosMo,助力长文本理解

夕小瑶科技说 原创作者 | 智商掉了一地、Python近年来,随着大型语言模型(LLM)的兴起,让多模态学习领域也得到了不断发展。本文作者深入探讨了视觉-语言预...
阅读原文

无需文本标注,TF-T2V把AI量产视频的成本打下来了!华科阿里等联合打造

机器之心专栏 机器之心编辑部在过去短短两年内,随着诸如LAION-5B 等大规模图文数据集的开放,Stable Diffusion、DALL-E 2、ControlNet、Composer ,效果惊人...
阅读原文

大翻车!斯坦福超火机器人自曝,研究者救场还受伤了,网友:放心了

金磊 丰色 发自 凹非寺量子位 | 公众号 QbitAI爆火的斯坦福全能家务机器人Mobile ALOHA,大!翻!!车!!! 你以为它擦个红酒轻而易举,但实际上却是这样的...
阅读原文

一句话精准视频片段定位!清华新方法拿下SOTA|已开源

陈厚伦 投稿量子位 | 公众号 QbitAI只需一句话描述,就能在一大段视频中定位到对应片段! 比如描述“一个人一边下楼梯一边喝水”,通过视频画面和脚步声的匹配...
阅读原文

因为它,马斯克和兵马俑都跳起了《科目三》

一张照片就能让马斯克、梅西等各大名人魔性跳舞,甚至连火爆全网的科目三都能安排上。 这可不是什么高深 AI 技术,阿里通义千问移动端新增的「全民舞王」功能...
阅读原文

兵马俑跳《科目三》,是我万万没想到的

金磊 发自 凹非寺量子位 | 公众号 QbitAI家人们,火爆全球的魔性舞蹈《科目三》,谁能料到,就连兵马俑也开始跳上了! 热度还居高不下,瞬间被轰上了热搜,小...
阅读原文

马斯克也逃不过「科目三」,阿里这个应用都要把外国人馋哭了

机器之心原创 作者:陈萍、大盘鸡阿里开年整新活了。最近,不少社交平台都被一种名为「科目三」的舞蹈视频刷屏了,摇花手、半崴不崴的脚,配合着节奏鲜明的音...
阅读原文

短剧时代即将来临?AI自动生成剧本和多场景长视频

大数据文摘授权转载自将门创投 作者:HiDream.ai 近年来随着扩散模型(diffusion models)的进步和发展,给定文本提示进行高质量视频生成技术有着显著的提升...
阅读原文

Meta清华校友推全新AI「视频生视频」方法!单张A100生成「男人秒变猩猩」大片

新智元报道编辑:编辑部 【新智元导读】今年,会不会是AI视频生成模型的元年?UT Austin联手Meta团队提出了一个全新V2V模型FlowVid,能够在1.5分钟内生成4秒...
阅读原文

文生视频下一站,Meta已经开始视频生视频了

机器之心报道 编辑:小舟、大盘鸡‍ 文本指导的视频到视频(V2V)合成在各个领域具有广泛的应用,例如短视频创作以及更广泛的电影行业。扩散模型已经改变了图...
阅读原文
1434445464754