Sora完整能力曝光!多模态视频理解或成为下次爆点

Sora完整能力曝光!多模态视频理解或成为下次爆点

AIGC动态欢迎阅读

原标题:Sora完整能力曝光!多模态视频理解或成为下次爆点
关键字:商标注册,模型,视频,能力,图像
文章来源:夕小瑶科技说
内容字数:1063字

内容摘要:


夕小瑶科技说 原创作者 | 王二狗大家好我是二狗。
就在今天,据推特大V“小互”分享,Sora的完整能力曝光,根据OpenAI 申请的SORA™商标注册描述显示:
除了众所周知文生图和文生视频之外,Sora还具备多模态图像视频理解能力——
对视频和图像进行识别、处理、分析、理解。
下面是SORA™商标注册描述截图:
OpenAI 总是处处抢先一步Sora 模型文生视频的强大,大家都见识到了。
下面是 Sora 模型生成的鲜花老虎漫天飞舞的视频。
而这次 Sora 模型暴露出来的多模态图像视频理解能力就很值得人玩味。
毕竟此前几天,Sora 模型正是在谷歌发布拥有多模态视频理解能力的Gemini 1.5之后几个小时才发布的。
Sora 模型的多模态视频理解或成为下次爆点。
同时这正是 OpenAI 的宣发理念——气死对手,永远占领用户心智。
前几日,据昆仑万维创始人周亚辉剧透,OpenAI将很快发布GPT4.5,而且估计会故意选择 Anthropic 发布Claude 3的时候发布。
Sora模型离不开中国??就在OpenAI发布Sora 模型改变世界的时候。
在国内,竟然有报道称Sor


原文链接:Sora完整能力曝光!多模态视频理解或成为下次爆点

联系作者

文章来源:夕小瑶科技说
作者微信:xixiaoyaoQAQ
作者简介:更快的AI前沿,更深的行业洞见。聚集25万AI一线开发者、互联网中高管和机构投资人。一线作者来自清北、国内外顶级AI实验室和大厂,兼备行业嗅觉与报道深度。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...