AIGC动态欢迎阅读
原标题:解剖Sora:37页论文逆向工程推测技术细节,微软参与,华人团队出品
关键字:报告,视频,模型,编码器,视觉
文章来源:量子位
内容字数:12694字
内容摘要:
西风 发自 凹非寺量子位 | 公众号 QbitAISora刚发布不久,就被逆向工程“解剖”了?!
来自理海大学、微软研究院的华人团队发布了首个Sora相关研究综述,足足有37页。
他们基于Sora公开技术报告和逆向工程,对模型背景、相关技术、应用、现存挑战以及文本到视频AI模型未来发展方向进行了全面分析。
连计算机视觉领域的AI生成模型发展史、近两年有代表性的视频生成模型都罗列了出来:
网友们也属实没想到,仅仅过了半个月、Sora还暂未公开仅有部分人可使用,学术圈相关研究竟出现得这么快。
不少网友表示,综述非常全面有条理,建议全文阅读。
那么这篇综述具体都讲了啥?
量子位在不改变原意的基础上,对部分内容进行了整理。
目录
逆向工程剖析Sora技术细节
整体架构
多样性视觉数据预处理
指令调优:视频摘要生成器
视频提示工程
Sora具有里程碑式意义
Sora的五大应用前景及局限性
逆向工程剖析Sora技术细节众所周知,Sora发布后,OpenAI紧接着发布了技术报告,但未详细透露技术细节,被有的网友吐槽OpenAI果然还是这么“Close”。
学术圈的猜测也是五花八门,ResNeXt一作
原文链接:解剖Sora:37页论文逆向工程推测技术细节,微软参与,华人团队出品
联系作者
文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...