谷歌抛出王炸锏,先人一步开启Agent新时代。
原标题:谷歌发布Gemini2.0,开启Agent新时代
文章来源:AI科技评论
内容字数:6311字
谷歌Gemini 2.0发布,开启Agent新时代
在OpenAI持续推出新产品的背景下,谷歌于深夜发布了其最新的AI模型Gemini 2.0,并称其为“我们迄今为止最新、功能最强大的AI模型”。这标志着谷歌在向“Agent”时代迈进的一大步。
1. Gemini 2.0的多模态能力
Gemini 2.0是第一个实现原生多模态输入输出的模型,支持图片、视频和音频等多种数据形式的处理。相比于前一版本,2.0的速度提升了两倍,能够更加高效地生成图像与文本混合的内容,并原生支持多语言文本转语音功能。此外,Gemini 2.0还可以调用Google Search、代码执行等多种工具。
2. 新AI产品的推出
基于Gemini 2.0,谷歌推出了三个新的AI智能体原型:
- Project Astra:通用大模型助手,具备多语言对话能力,能够在不同工具之间进行实时推理。
- Project Mariner:浏览器助手,能理解浏览器上的信息并自动执行任务,如在线购物、查找航班等。
- Jules:编程助手,集成于GitHub工作流程中,帮助开发者自动化代码修改及调试。
3. AI Agent的未来
谷歌的Agent技术旨在无需人工干预即可自主执行任务,为用户提供便利。首席执行官桑达尔·皮查伊表示,Agent能够更好地了解环境并在监督下进行多步骤操作。谷歌计划在2025年开启真正的“AI智能体时代”,并期待Gemini 2.0的推理能力能够引入更多复杂主题和多步骤问题的处理。
4. 安全与技术保障
为防止滥用,谷歌为生成的音频和图像添加了水印,并使用SynthID技术进行标记。Gemini 2.0基于第六代TPU Trillium构建,性能大幅提升,支持开发者利用多模态输入和输出进行应用开发。
谷歌的这一系列举措展示了AI在各个领域的广泛应用潜力,未来将如何改变人们的生活和工作还需拭目以待。
联系作者
文章来源:AI科技评论
作者微信:
作者简介:雷峰网旗下AI新媒体。聚焦AI前沿研究,关注AI工程落地。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...