突破界限：OpenAI即将推出全新多模态大模型Gobi，颠覆AI应用！

AIGC动态3年前 (2023)发布元动乾坤

原标题：OpenAI大模型新进展！将推出多模态大模型，新项目Gobi筹备中！
文章来源：元动乾坤
内容字数：2776字

多模态大语言模型之争：OpenAI与谷歌的竞赛

根据《The Information》的报道，OpenAI正在加快推出其多模态大语言模型GPT-Vision，以在谷歌发布Gemini之前抢占市场。此次竞争被视为AI领域的苹果与安卓之争，展示了未来AI大模型的发展趋势。

1. Gobi与Gemini的竞争

OpenAI计划在GPT-4的基础上推出Gobi，这是一款从一开始就设计为多模态的大语言模型，能够处理文本、图像、音频等多种输入形式。相较于之前的GPT-3.5仅支持文本输入，GPT-4已经具备部分多模态功能，但该功能尚未广泛开放使用。与此同时，谷歌的Gemini已经向部分外部公司展示，显示出其较强的文本和图像处理能力。

2. OpenAI的技术挑战

尽管OpenAI在多模态技术上不断推进，但Gobi尚未开始训练，且是否能成为GPT-5仍未可知。谷歌在多模态数据方面拥有独特优势，例如来自搜索引擎和YouTube的专有数据，这可能使其在多模态大语言模型的竞争中占据上风。此外，早期使用Gemini的人士表示，其生成的错误答案较少，显示出较高的准确性。