免费GPT-4o来袭，音频视觉文本实现「大一统」

AIGC动态2年前 (2024)发布 AI科技评论

AIGC动态欢迎阅读

原标题：免费GPT-4o来袭，音频视觉文本实现「大一统」
关键字：模型,语音,用户,文本,音频
文章来源：AI科技评论
内容字数：5929字

内容摘要：

OpenAI「魔法」降临。作者 | 赖文昕
今天凌晨，即北京时间5月14日1点整，OpenAI 召开了首场春季发布会，CTO Mira Murati 在台上和团队用短短不到30分钟的时间，揭开了最新旗舰模型 GPT-4o 的神秘面纱，以及基于 GPT-4o 的 ChatGPT，均为免费使用。
此前，有传言称 OpenAI 将推出 AI 搜索引擎，旨在与谷歌明天举办的 I/O 开发者大会一较高下，一度引发了公众的热烈讨论。
不过 Sam Altman 随后在 X（原）上表示，要展示的并非 GPT-5 或搜索引擎，而是一些令人期待的创新成果，他本人对此充满期待，认为其像魔法一样神奇。
那么，GPT-4o 是否真的如 Sam Altman 所说，是 OpenAI 带来的「新魔法」呢？
1多模态实时语音助手‍
更快更全更有情感
登台后，Mira Murati 宣布了 ChatGPT 的桌面版本和新 UI，紧接着就介绍了本场发布会的主角——GPT-4o 。
在发布会上，Mira Murati 与团队成员 Mark Chen、Barret Zoph一起，重点展示了基于 GPT-4o 的 Cha

原文链接：免费GPT-4o来袭，音频视觉文本实现「大一统」