价格只有Deepseek V3九分之一 ,天生多模态。Deepseek 要沦为牛夫人了
原标题:Gemini 2.0霸榜,价格卷哭DeepSeek V3,性价比新王诞生!
文章来源:夕小瑶科技说
内容字数:3952字
谷歌Gemini 2.0家族强势来袭,霸榜LMSYS!
谷歌近日重磅发布Gemini 2.0家族三款新模型:Gemini 2.0 Pro、Gemini 2.0 Flash和Gemini 2.0 Flash-Lite,并在LMSYS排行榜上取得骄人成绩,Gemini 2.0 Pro更是荣登榜首,家族成员均跻身前十。
1. 三款模型性能亮点
此次发布的三款模型各有侧重,满足不同需求:
- Gemini 2.0 Pro (Experimental): 作为旗舰模型,Pro版本在编码和推理方面表现卓越,支持高达2M tokens的上下文窗口,深度整合Google搜索和代码执行功能。目前已在Google AI Studio、Vertex AI和Gemini Advanced平台上线。
- Gemini 2.0 Flash: 定位为“高效主力模型”,兼顾速度和性能,适合低延迟应用场景。支持1M tokens上下文窗口,拥有优秀的多模态推理能力,并即将推出图像生成和文本转语音功能。已在Vertex AI Studio和Google AI Studio平台正式发布。
- Gemini 2.0 Flash-Lite (Preview): 主打高性价比,在速度、成本和性能之间取得平衡。与1.5 Flash相比,在相同速度和成本下,多数基准测试中表现更佳,同样支持1M tokens上下文窗口。
Gemini 2.0 Pro在几乎所有基准测试中均获得最高分,尤其在代码生成和复杂数学问题上表现突出,长文档理解能力也显著提升。
2. 令人惊喜的定价策略
谷歌Gemini 2.0 Flash的百万Token输入价格低于1美元,展现出极高的性价比。相比之下,Deepseek V3的百万输入价格为1美元,R1推理价格为4美元。这表明谷歌在定价策略上具有显著优势,也体现了其对AI普惠的承诺。
3. 实际应用案例测试
网友们对Gemini 2.0进行了实际测试,结果显示:
- 在基于物理引擎的弹球游戏中,Gemini 2.0 Pro的表现与o3 mini不相上下,但Flash和Flash-Lite版本表现欠佳。
- 在处理100个小球的复杂弹跳场景中,Gemini 2.0的表现令人满意。
- 在经典的“草莓”问题中,Gemini 2.0 Pro意外答错,而Flash Thinking Experimental则答对,凸显了不同模型在特定任务上的差异。
Google DeepMind首席科学家Jeff Dean亲自测试了Gemini 2.0 Pro的编程能力,成功在18.9秒内完成了Boggle游戏代码编写。
4. 谷歌AI战略布局
Google DeepMind CEO对Gemini 2.0的更新充满信心,认为此次发布为未来智能体奠定了基础。谷歌CEO皮查伊也曾表示2025年将是谷歌AI加速发展的关键时期。Gemini 2.0家族的多版本选择策略,如同一个AI工具箱,满足不同用户的需求,展现了谷歌在AI领域实用性至上的战略布局。
联系作者
文章来源:夕小瑶科技说
作者微信:
作者简介:低负担解码AI世界,硬核也可爱!聚集35万AI发烧友、开发者和从业者,广泛覆盖互联网大厂中高管、AI公司创始人和机构投资人。一线作者来自清北、国内外顶级AI实验室和大厂,兼备敏锐的行业嗅觉和洞察深度。商务合作:zym5189