免费GPT-4o来袭,音频视觉文本实现「大一统」

免费GPT-4o来袭,音频视觉文本实现「大一统」

AIGC动态欢迎阅读

原标题:免费GPT-4o来袭,音频视觉文本实现「大一统」
关键字:模型,语音,用户,文本,音频
文章来源:AI科技评论
内容字数:5929字

内容摘要:


OpenAI「魔法」降临。作者 | 赖文昕
今天凌晨,即北京时间5月14日1点整,OpenAI 召开了首场春季发布会,CTO Mira Murati 在台上和团队用短短不到30分钟的时间,揭开了最新旗舰模型 GPT-4o 的神秘面纱,以及基于 GPT-4o 的 ChatGPT,均为免费使用。
此前,有传言称 OpenAI 将推出 AI 搜索引擎,旨在与谷歌明天举办的 I/O 开发者大会一较高下,一度引发了公众的热烈讨论。
不过 Sam Altman 随后在 X(原推特)上表示,要展示的并非 GPT-5 或搜索引擎,而是一些令人期待的创新成果,他本人对此充满期待,认为其像魔法一样神奇。
那么,GPT-4o 是否真的如 Sam Altman 所说,是 OpenAI 带来的「新魔法」呢?
1多模态实时语音助手‍
更快更全更有情感
登台后,Mira Murati 宣布了 ChatGPT 的桌面版本和新 UI,紧接着就介绍了本场发布会的主角——GPT-4o 。
在发布会上,Mira Murati 与团队成员 Mark Chen、Barret Zoph一起,重点展示了基于 GPT-4o 的 Cha


原文链接:免费GPT-4o来袭,音频视觉文本实现「大一统」

联系作者

文章来源:AI科技评论
作者微信:aitechtalk
作者简介:雷峰网旗下AI新媒体。聚焦AI前沿研究,关注AI工程落地。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...