标签:视频
百度又放大招!视觉生成模型 Hallo2 或将落地数字人等场景
作者 | 华卫 近日,百度联合复旦大学等发布 Hallo2,一个可以生成长达数小时且分辨率为 4K 的人物动画的视觉模型。Hallo2 目前已经在 GitHub 平台开源,供全...
相机+AI视频生成,港大CUBE框架入选ICIP,无需训练实现可控视频生成
CUBE团队 投稿量子位 | 公众号 QbitAI在这个信息爆炸的时代,如何让AI生成的视频更具创意,又符合特定需求? 来自香港大学的最新研究《基于事件、无需训练的...
无需训练即可创建数字人,字节PersonaTalk视频口型编辑超SOTA
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
清华系AI视频工具,用10天给《毒液》官方做了个片子
《毒液》AI短片主创团队量子位 | 公众号 QbitAI国产AI视频大模型牵手国际顶尖IP! 最近票房单日冠军漫威《毒液3》的水墨风宣传片,竟然是用AI做的。就是下面...
机器人轻松模仿人类,还能泛化到不同任务和智能体!微软新研究,学习人类和机器人统一动作表示
IGOR团队 投稿量子位 | 公众号 QbitAI让机械臂模仿人类动作的新方法来了,不怕缺高质量机器人数据的那种。 微软提出图像目标表示(IGOR,Image-GOal Represen...
类Sora大模型入秋:访问量骤降,被李彦宏泼冷水,“十年难见收益”
Sora还没来,AI视频赛道一夜入秋? 作者|李水青 编辑|心缘 当下,各路生成式AI工具落地如火如荼。 据全球知名数据机构SimilarWeb统计,2024年9月,稳居全球第...
搞定图像+文本+视频大一统!智源发布多模态世界模型Emu3:下一个token预测直通AGI
下一个token预测,通向多模态AGI。 OpenAI前首席科学家、联合创始人Ilya Sutskever曾在多个场合表达观点:只要能够非常好的预测下一个token,就能帮助人类达...
智源 Emu3 证明多模态模型新范式:只需基于下一个 token 预测
只需基于下一个 token 预测,智源 Emu3 重新定义多模态模型。OpenAI前首席科学家、联合创始人Ilya Sutskever曾在多个场合表达观点:只要能够非常好的预测下一...
Ilya预言成真,下一个token预测直达AGI!智源首发原生多模态世界模型Emu3,不用扩散
新智元报道编辑:编辑部 HYZ 【新智元导读】最近,Ilya向黄仁勋描述「只要能预测下一个token,就能达到AGI」的视频再次爆火全网,他的预言刚刚竟被证实?智源...
Ilya观点得证!仅靠预测下一个token统一图像文本视频,智源发布原生多模态世界模型Emu3
梦晨 发自 凹非寺量子位 | 公众号 QbitAIOpenAI前首席科学家、联合创始人Ilya Sutskever曾在多个场合表达观点: 只要能够非常好的预测下一个token,就能帮助...
视频、图像、文本,只需基于下一个Token预测:智源Emu3发布,验证多模态模型新范式
机器之心发布 机器之心编辑部OpenAI 前首席科学家、联合创始人 Ilya Sutskever 曾在多个场合表达观点:只要能够非常好的预测下一个 token,就能帮助人类达到...
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
视频生成模型变身智能体:斯坦福Percy Liang等提出VideoAgent,竟能自我优化
机器之心报道 编辑:Panda现在正是「文本生视频」赛道百花齐放的时代,而且其应用场景非常多,比如生成创意视频内容、创建游戏场景、制作动画和电影。甚至有...
万字回顾YouTube的商业化之路:押注长视频、广告模式误打误撞、给创作者高分成
作为全球最大的中长视频平台,YouTube 今年的月活超过 27 亿,做个比较的话,比抖音和 TikTok 加起来的月活还多,而收入方面,Youtube 去年实现了 315 亿美元...
从威尔・史密斯鬼畜吃面到「Her」,这些幕后技术正在推动AI视频时代的到来
机器之心原创 作者:张倩还记得「威尔・史密斯吃意大利面」的 AI 鬼畜视频吗?在这些视频里,威尔・史密斯的面部表情、动作都非常夸张,还充满了扭曲、变形。...