标签:视频
终局之战!OpenAI Sora大佬专访:AI视频模型仍处在GPT-1时代
新智元报道编辑:alan 【新智元导读】Sora一出,谁与争锋!近日,Sora团队的三位负责人Aditya Ramesh、Tim Brooks和Bill Peebles接受了采访,解读了Sora在模...
OpenAI Sora负责人最新万字干货深访 · 完整版+视频
来源:图灵人工智能 文:天空之城·城主 在视频生成领域,只有两种模型:OpenAI Sora模型,以及其他不是Sora的模型。 Sora视频生成的能力相比其他视频生成模型...
清华团队国产“Sora”火了!画面效果对标OpenAI,长度可达16秒,还能读懂物理规律
允中 发自 凹非寺量子位 | 公众号 QbitAISora席卷世界,也掀起了全球竞逐AI视频生成的热潮。 就在今天,国内又有一支短片引发关注。 视频来自生数科技联合清...
“很接近Sora”,直击清华团队视频大模型Vidu发布现场|甲子光年
中国首个长时长、高一致性、高动态性视频大模型。作者|王博 事先没有一点声张,今天上午,中国首个长时长、高一致性、高动态性视频大模型Vidu就在中关村论坛...
当前最强国产Sora!清华团队突破16秒长视频,懂多镜头语言,会模拟物理规律
机器之心原创 作者:张倩你说箱子里要装满钻石,于是箱子被钻石填满,比实拍还要耀眼。这样的技能,哪个剧组不喜欢?这是前段时间 Adobe 旗下的视频剪辑软件 ...
今日arXiv最热大模型论文:大模型也来看球,还能判断是否犯规
夕小瑶科技说 原创作者 | 谢年年在足球世界,裁判的哨声可谓“千金难买”,因为它能直接决定俱乐部的钱包是鼓是瘪。但球场变化莫测,非常考验裁判的水平。 2022...
LLaMA 3:大模型之战的新序幕
作者 | 符尧 OneFlow编译 翻译|杨婷、宛子琳、张雪聃 本文要点概览: 文本数据的扩展可能已经达到了极限,因为易于获取的网络文本资源(如Common Crawl、Git...
Open-Sora 全面开源升级:支持单镜头16s视频生成和720p分辨率
Open-Sora 在开源社区悄悄更新了,现在支持单镜头长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、...
Open-Sora全面开源升级:支持16s视频生成和720p分辨率
机器之心发布 机器之心编辑部Open-Sora 在开源社区悄悄更新了,现在单镜头支持长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像...
视频生成技术与应用 AI 技术论坛圆满收官
致力于助力企业和广大从业者掌握 AI 视频生成技术前沿,把握时代机遇的“视频生成技术与应用 — Sora 时代”——机器之心 AI 技术论坛日前圆满收官。 活动当天,北...
Open-Sora 全面开源升级:支持 16s 视频生成和 720p 分辨率
最近,AI 科技评论发现,国产视频生成模型 Open-Sora 在开源社区悄悄更新了! 现在支持长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文...
Meta 眼镜支持多模态 Llama 3,实时翻译、物体识别,AI 眼镜的机会来了!
来自 Meta 官方消息,Meta 自家的雷朋智能眼镜,开始支持多模态版的 Llama 3 了!要知道,Llama 3 的开源版本还没支持多模态。 戴上这副智能眼镜,外出旅行坐...
一张照片+音频=超逼真数字人视频!VASA-1模型拉开「实时交互」大幕
新智元报道编辑:LRS 【新智元导读】仅需一张照片加一段音频,即可生成具有精确唇音同步、逼真面部行为和自然头部运动的超逼真说话面部视频,并且生成速度快...
在线教程丨刘强东数字人首秀交易额破5千万!用GeneFace++ 生成实时说话数字人
作者:十九 编辑:李宝珠,三羊 封面图来源:GeneFace++ GeneFace++:输入一段语音,就能生成目标人脸的说话视频。近日,京东创始人刘强东化身「采销东哥 AI ...
微软「诈骗届」王牌框架,真到可怕!一张照片+音频即可生成数字人
新智元报道编辑:LRS 【新智元导读】想要做出一段能够「以假乱真的人物说话视频」的门槛到底低到什么程度了?仅需一张照片加一段音频,就能生成一段堪称真实...