标签:视频
口型几乎完美、还能卡点,霉霉说地道中文的视频火了,背后AI工具原来是它
机器之心报道编辑:杜伟、大盘鸡这么看来,AI 配音真的可以「以假乱真、真假难辨」。这两天,美国女歌星霉霉(泰勒・斯威夫特)一则说中文的短视频在各社交平...
AIGC时代的视频扩散模型,复旦等团队发布领域首篇综述
机器之心专栏机器之心编辑部AI 生成内容已经成为当前人工智能领域的最热门话题之一,也代表着该领域的前沿技术。近年来,随着 Stable Diffusion、DALL-E3、Co...
复旦大合华为诺亚提出VidRD框架,实现迭代式的高质量视频生成
机器之心专栏机器之心编辑部本文提出了一个名为 “Reuse and Diffuse” 的框架。该框架可以在 LDM 已经生成的少部分视频帧之后,产生更多的视频帧,从而实现迭...
狂揽4k star,AI通过强化学习玩宝可梦,两万场后成功拿下
机器之心报道编辑:大盘鸡AI 的宝可梦之旅。是不是说起「口袋妖怪」,你就不困了?「口袋妖怪」是「宝可梦」的非官方译名。从 1996 年至今,它可以被分为数个...
下一个李子柒,可能是 AI 做的
AIGC创作者OpenAI 创始人Sam Altman 曾提出一个观点:过去通常认为 AI 最先影响的是体力劳动等重复工作,最后才是创造性工作,但现在看来却以相反的顺序进行...
AI视频生成卷出新高度:高清电影画质免费无限玩,号称“史上最强”
丰色 发自 凹非寺量子位 | 公众号 QbitAI号称“史上最强大的视频生成AI”诞生了。效果真的还不赖:一句提示词就能生成,主打一个高清、16:9电影画质。超现实主...
下一个 iPhone?为时尚早
苹果向左Meta向右文|莫崇宇编辑|李超凡2007 年 1 月 9 日,乔布斯发布了初代 iPhone,开始市场上没有泛起什么水花。这一年《福布斯》杂志还发布了一篇封面...
在图像、视频生成上,语言模型首次击败扩散模型,tokenizer是关键
机器之心报道编辑:张倩、陈萍为什么语言模型在视觉生成方面落后于扩散模型?来自谷歌、CMU 的研究表明,tokenizer 是关键。大型语言模型(LLM 或 LM)一开始...
研讨会预告!三位大咖将直播讲解大模型驱动的互联网视频理解与生成
从9月起,智东西公开课联合宁畅计划推出 10 期在线研讨会,将分别邀请 NVIDIA 嘉宾和一位行业嘉宾,围绕大型语言模型训练加速、自动驾驶、互联网视频理解与生...
自动驾驶独角兽如此造假,LeCun都服了
明敏 发自 凹非寺量子位 | 公众号 QbitAI你以为这是个平平无奇的自动驾驶视频?NO、NO、NO……这其实是完全由AI从头生成的。没有一帧是“真的”。不同路...
Pixel 8 系列正式发布!这才是 Google 的 AI 锏
Pixel 8 系列来了今年有个怪现象,发布会还未召开,许多信息就已经泄露得七七八八。在 MadeByGoogle 23: Keynote 新品发布会的召开之前,关于发布会上的系列...
跟OPPO工程师聊了之后,我才知道国产厂商首发适配安卓有多难|视频
量子位(视频版) 假装发自 凹非寺Android 14正式版,如今终于来了。忘了从啥时候开始,国产厂商抢首发安卓适配就变成了一种常态。更快上线新系统,除了能让...
特斯拉「擎天柱」机器人视频爆了!端到端AI大脑加持,挑战高难度瑜伽
新智元报道编辑:桃子 好困【新智元导读】特斯拉人形机器人「擎天柱」最新视频公开,在端到端神经网络加持下,能够精准分类物体、找准身体平衡感,让众多网友...
马斯克机器人大进化!全新技能解锁,启用端到端神经网络
梦晨 发自 凹非寺量子位 | 公众号 QbitAI马斯克的机器人大进化。一年前首次上台时动作还略显僵硬,现在居然成了瑜伽大师。还用上了自动驾驶系统同款的端到端...
秀才拉黑了给他打赏十几万的流水线女工
一秀落万秀生本文来自《北青深一度》作者:纪佳文 张璐 罗楚骐编辑:刘汨秀才的短视频账号停留在了 9 月 2 日晚。在这之前,有 1200 多万粉丝为他的视频内容...