Sora 团队负责人 Aditya Ramesh 对话谢赛宁丨压缩一切！视觉与语言模态的融合

AIGC动态2年前 (2024)发布大数据文摘

AIGC动态欢迎阅读

原标题：Sora 团队负责人 Aditya Ramesh 对话谢赛宁丨压缩一切！视觉与语言模态的融合
关键字：模型,图像,文本,语言,政策
文章来源：大数据文摘
内容字数：0字

内容摘要：

大数据文摘受权转载自智源社区
2024 年 6 月 14 日，一年一度的智源大会又迎来重磅嘉宾。
当红视频生成大模型「Sora」团队的负责人Aditya Ramesh在2024智源大会开幕式上发表了题为「Language as the Scaffolding for Visual Intelligence」的主旨演讲。他介绍了生成式建模领域近年来的发展历程以及未来的前进方向，分享了 OpenAI 从研发 DALL·E、iGPT、CLIP 到 Sora 的一次次研究指导思想的转变，讲述其团队为何一步步将生成式模型做向极致。站在人工智能 3.0 的拐点，Aditya Ramesh 的宝贵经验具有巨大的启发意义。
下面是智源社区对 Aditya Ramesh 演讲主要内容的编译：
大模型初探：DALL·E——扩展模型规模的启示
2021 年 2 月，我们发布了著名的「文生图」人工智能系统 DALL·E，它是一个同时使用文本和量化压缩后的图像以自回归方式训练的 Transformer 模型。该系统可以将文字描述映射为量化的创作各种风格的逼真图像。之所以决定开展该项目，是因为我们看到使用 Tra

原文链接：Sora 团队负责人 Aditya Ramesh 对话谢赛宁丨压缩一切！视觉与语言模态的融合

联系作者

文章来源：大数据文摘
作者微信：BigDataDigest
作者简介：普及数据思维，传播数据文化

阅读原文

# AIGC动态 # 图像 # 政策 # 文本 # 模型 # 语言

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

Sora 团队负责人 Aditya Ramesh 对话谢赛宁丨压缩一切！视觉与语言模态的融合

AIGC动态欢迎阅读

内容摘要：

联系作者

Gemini视频推理遥遥领先GPT-4o，Jeff Dean连续转发三次，首个视频多模态基准Video-MME来了

Science Robotics见刊发表剑桥大学成功开发人类“第六指”

相关文章

暂无评论

Sora 团队负责人 Aditya Ramesh 对话谢赛宁丨压缩一切！视觉与语言模态的融合​

AIGC动态欢迎阅读

内容摘要：

联系作者

Gemini视频推理遥遥领先GPT-4o，Jeff Dean连续转发三次，首个视频多模态基准Video-MME来了

​Science Robotics见刊发表 剑桥大学成功开发人类“第六指”

相关文章

暂无评论

Sora 团队负责人 Aditya Ramesh 对话谢赛宁丨压缩一切！视觉与语言模态的融合

Science Robotics见刊发表剑桥大学成功开发人类“第六指”