标签：视频

翻车，才是斯坦福炒菜机器人学习人类的常态

机器之心报道作者：大盘鸡、陈萍Mobile ALOHA也有翻车时刻。电视剧中角色的惊艳亮相不一定能打动你的心，但斯坦福全职管家兼御用大厨一定能拿下你对机器人...

阅读原文

AIGC动态

2年前 (2024)

Pika一键生成3秒视频，够做一个表情包

大数据文摘授权转载自AI科技评论作者：晓龙省流：Pika是一款文字生成视频的AI模型，可输入文字、上传图片乃至录制视频后再通过AI进一步生成一个新的视频。...

阅读原文

AIGC动态

2年前 (2024)

Pika 一键生成 3 秒视频，够做一个表情包

省流：Pika是一款文字生成视频的AI模型，可输入文字、上传图片乃至录制视频后再通过AI进一步生成一个新的视频。在2023年11月，Pika开放端口在Discord进行测试...

阅读原文

AIGC动态

2年前 (2024)

AI解读视频张口就来？这种「幻觉」难题Vista-LLaMA给解决了

机器之心专栏机器之心编辑部Vista-LLaMA 在处理长视频内容方面的显著优势，为视频分析领域带来了新的解决框架。近年来，大型语言模型如 GPT、GLM 和 LLaMA ...

阅读原文

AIGC动态

2年前 (2024)

斯坦福爆火机器人失败！炒虾做家务逗猫都是人类遥控的，AI厨师和女仆还很遥远

夕小瑶科技说原创作者 | 王二狗大家好，我是二狗。这两天，想必大家都看到了斯坦福华人团队的 ALOHA 机器人爆火网络。既能炒虾仁滑蛋、干贝烧鸡和耗油生菜...

阅读原文

AIGC动态

2年前 (2024)

新加坡国立大学发布图文预训练框架 CosMo，助力长文本理解

夕小瑶科技说原创作者 | 智商掉了一地、Python近年来，随着大型语言模型（LLM）的兴起，让多模态学习领域也得到了不断发展。本文作者深入探讨了视觉-语言预...

阅读原文

AIGC动态

2年前 (2024)

无需文本标注，TF-T2V把AI量产视频的成本打下来了！华科阿里等联合打造

机器之心专栏机器之心编辑部在过去短短两年内，随着诸如LAION-5B 等大规模图文数据集的开放，Stable Diffusion、DALL-E 2、ControlNet、Composer ，效果惊人...

阅读原文

AIGC动态

2年前 (2024)

大翻车！斯坦福超火机器人自曝，研究者救场还受伤了，网友：放心了

金磊丰色发自凹非寺量子位 | 公众号 QbitAI爆火的斯坦福全能家务机器人Mobile ALOHA，大！翻！！车！！！你以为它擦个红酒轻而易举，但实际上却是这样的...

阅读原文

AIGC动态

2年前 (2024)

一句话精准视频片段定位！清华新方法拿下SOTA｜已开源

陈厚伦投稿量子位 | 公众号 QbitAI只需一句话描述，就能在一大段视频中定位到对应片段！比如描述“一个人一边下楼梯一边喝水”，通过视频画面和脚步声的匹配...

阅读原文

AIGC动态

2年前 (2024)

因为它，马斯克和兵马俑都跳起了《科目三》

一张照片就能让马斯克、梅西等各大名人魔性跳舞，甚至连火爆全网的科目三都能安排上。这可不是什么高深 AI 技术，阿里通义千问移动端新增的「全民舞王」功能...

阅读原文

AIGC动态

2年前 (2024)

兵马俑跳《科目三》，是我万万没想到的

金磊发自凹非寺量子位 | 公众号 QbitAI家人们，火爆全球的魔性舞蹈《科目三》，谁能料到，就连兵马俑也开始跳上了！热度还居高不下，瞬间被轰上了热搜，小...

阅读原文

AIGC动态

2年前 (2024)

马斯克也逃不过「科目三」，阿里这个应用都要把外国人馋哭了

机器之心原创作者：陈萍、大盘鸡阿里开年整新活了。最近，不少社交平台都被一种名为「科目三」的舞蹈视频刷屏了，摇花手、半崴不崴的脚，配合着节奏鲜明的音...

阅读原文

AIGC动态

2年前 (2024)

短剧时代即将来临？AI自动生成剧本和多场景长视频

大数据文摘授权转载自将门创投作者：HiDream.ai 近年来随着扩散模型（diffusion models）的进步和发展，给定文本提示进行高质量视频生成技术有着显著的提升...

阅读原文

AIGC动态

2年前 (2024)

Meta清华校友推全新AI「视频生视频」方法！单张A100生成「男人秒变猩猩」大片

新智元报道编辑：编辑部【新智元导读】今年，会不会是AI视频生成模型的元年？UT Austin联手Meta团队提出了一个全新V2V模型FlowVid，能够在1.5分钟内生成4秒...

阅读原文

AIGC动态

2年前 (2024)

文生视频下一站，Meta已经开始视频生视频了

机器之心报道编辑：小舟、大盘鸡‍ 文本指导的视频到视频（V2V）合成在各个领域具有广泛的应用，例如短视频创作以及更广泛的电影行业。扩散模型已经改变了图...

阅读原文

AIGC动态

2年前 (2024)

1…43 444546 47…54