一键生成 16 秒 1080P 视频,国产 Sora 的秘密,藏在这个清华系大模型团队中
AIGC动态欢迎阅读
原标题:一键生成 16 秒 1080P 视频,国产 Sora 的秘密,藏在这个清华系大模型团队中
关键字:模型,视频,架构,报告,科技
文章来源:Founder Park
内容字数:8513字
内容摘要:
2024 年,Sora 一直活在聚光灯下。
马斯克不惜溢美之词,称「人类愿赌服输」;红衣教主周鸿祎眼中,借助 Sora 人类实现 AGI 将缩减至一两年。就连卖付费课程的微商,也拿「Sora」重新组装了自己的镰刀。
这种狂热的蔓延,从美国到中国,从一级到二级甚至再到三级市场,像涟漪一样,播散向全世界。
因为,在理想情况下,长视频生成的底层逻辑,约等于世界模型。十几秒、几十秒的视频中,包含了基础的图像处理、空间关系、物理规律、因果逻辑等等现实规律与知识的映射。小处看,可以掀翻传统电影、游戏制作的桌子,大处看,通往通用人工智能,这是关键一步。
同时,在一众长视频生成算法中,Sora 的技术突破是具备革命性的。相比传统的 Stable Diffusion,Sora 采用的 Diffusion 加 Transformer 架构,既克服了 Stable Diffusion 扩展性的缺失,更是在生成内容的准确性和灵活性上有了质的飞跃。
唯一美中不足是,Sora 并非开源算法。
没了开源,也就没了复现的可能;没了复现可能,那么哪怕经管出身的合伙人睡前读物变成了《Scalable diffusion
原文链接:一键生成 16 秒 1080P 视频,国产 Sora 的秘密,藏在这个清华系大模型团队中
联系作者
文章来源:Founder Park
作者微信:Founder-Park
作者简介:来自极客公园,专注与科技创业者聊「真问题」。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...