Sora完整能力曝光！多模态视频理解或成为下次爆点

AIGC动态2年前 (2024)发布夕小瑶科技说

AIGC动态欢迎阅读

原标题：Sora完整能力曝光！多模态视频理解或成为下次爆点
关键字：商标注册,模型,视频,能力,图像
文章来源：夕小瑶科技说
内容字数：1063字

内容摘要：

夕小瑶科技说原创作者 | 王二狗大家好我是二狗。
就在今天，据大V“小互”分享，Sora的完整能力曝光，根据OpenAI 申请的SORA™商标注册描述显示：
除了众所周知文生图和文生视频之外，Sora还具备多模态图像视频理解能力——
对视频和图像进行识别、处理、分析、理解。
下面是SORA™商标注册描述截图：
OpenAI 总是处处抢先一步Sora 模型文生视频的强大，大家都见识到了。
下面是 Sora 模型生成的鲜花老虎漫天飞舞的视频。
而这次 Sora 模型暴露出来的多模态图像视频理解能力就很值得人玩味。
毕竟此前几天，Sora 模型正是在谷歌发布拥有多模态视频理解能力的Gemini 1.5之后几个小时才发布的。
Sora 模型的多模态视频理解或成为下次爆点。
同时这正是 OpenAI 的宣发理念——气死对手，永远用户心智。
前几日，据昆仑万维创始人周亚辉剧透，OpenAI将很快发布GPT4.5，而且估计会故意选择 Anthropic 发布Claude 3的时候发布。
Sora模型离不开中国？？就在OpenAI发布Sora 模型改变世界的时候。
在国内，竟然有报道称Sor

原文链接：Sora完整能力曝光！多模态视频理解或成为下次爆点