颠覆未来的多模态大模型:OpenAI全新项目Gobi即将揭晓!

AIGC动态1年前 (2023)发布 元动乾坤
3 0 0

颠覆未来的多模态大模型:OpenAI全新项目Gobi即将揭晓!

原标题:OpenAI大模型新进展!将推出多模态大模型,新项目Gobi筹备中!
文章来源:元动乾坤
内容字数:2776字

多模态大语言模型的竞争

根据《The Information》的报道,OpenAI正在加紧研发其多模态大语言模型GPT-Vision,试图在谷歌推出其多模态模型Gemini之前实现发布。这一竞争标志着OpenAI与谷歌在AI领域的激烈对抗,类似于苹果与安卓的竞争。

1. Gobi与Gemini的较量

OpenAI计划在推出GPT-Vision后,进一步推出更强大的多模态模型Gobi。与以文本为主的GPT-3.5相比,GPT-4已经具备了部分多模态功能,如图像输入,但其视觉输入尚未全面开放使用。Gobi将从一开始就专注于多模态能力,能够处理更多类型的信息并提供更全面的响应。目前,谷歌的Gemini已向少量外部公司展示,且据称其在准确性上表现更佳。

2. 数据优势与技术挑战

谷歌在多模态大语言模型方面的优势在于其丰富的专有数据来源,包括从搜索引擎和YouTube获得的文本、图像和音频信息。OpenAI则面临着在多模态功能上追赶的挑战,尽管其在GPT-4中已展示了部分相关能力。此外,训练Gobi的进展不明,尚不确定其能否成为新一代的GPT-5。

3. 信息安全与滥用问题

多模态功能的推出也引发了信息安全的担忧。OpenAI在发布GPT-4的多模态功能时,仅与特定公司合作,避免潜在的滥用风险。其工程师团队正在努力解决视觉功能可能被恶意利用的问题,例如自动验证码或进行面部识别追踪。谷歌也面临类似挑战,并表示承诺将确保其AI产品的负责任开发。

4. 未来展望:AIGC的焦点

多模态大语言模型的开发正在成为AI领域的新趋势,OpenAI与谷歌之间的竞争不仅是技术上的较量,也可能引发更广泛的社会讨论,包括技术应用、合作、监管与伦理等方面。随着Gobi与Gemini的推出,这场竞争将为未来AI大模型的发展奠定基础。


联系作者

文章来源:元动乾坤
作者微信:
作者简介:订阅前沿信息技术,了解活动动态,分享技术信息

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...