20万卡吞金兽 Grok 3 炸裂登场,卡帕西大神亲测:性能超过DeepSeek R1!马斯克:短期不开源

Grok 3发布后,能否改写以OpenAI、谷歌、Meta为核心的AI新秩序?

20万卡吞金兽 Grok 3 炸裂登场,卡帕西大神亲测:性能超过DeepSeek R1!马斯克:短期不开源

原标题:20万卡吞金兽 Grok 3 炸裂登场,卡帕西大神亲测:性能超过DeepSeek R1!马斯克:短期不开源
文章来源:AI前线
内容字数:10045字

xAI发布Grok 3:挑战LLM格局的超级AI模型

本文总结了xAI公司发布的新一代AI模型Grok 3及其mini版本的主要特点、性能表现和未来展望。

  1. Grok 3的发布与目标

    埃隆·马斯克旗下xAI公司发布了新一代AI模型Grok 3和Grok 3-mini,马斯克将其称为“迄今为止最强大的AI模型”。Grok一词源于科幻小说,意为“深刻理解”。xAI团队耗时214天建成并扩建了包含20万张英伟达GPU的Colossus超级计算机用于训练Grok 3。其目标是完成现实世界中的复杂任务,例如制造特斯拉汽车、解决太空发射问题等,并预测未来两年内AI将超越人类,实现科学突破。

  2. Grok 3的性能与特点

    Grok 3最显著的特点是集成了推理能力,能够在解决问题前进行思考。在数学、科学和编码方面,Grok 3及其mini版本均表现优异,在多个基准测试中击败了其他竞争对手,例如在Arena测试中得分超过1400分,在AIME考试中取得93%的成绩。Grok 3-mini的性能虽然略逊于Grok 3,但也优于其他主流模型。xAI还推出了DeepSearch,一种新型搜索引擎和Agent工具,能够辅助编程和解答日常问题。

  3. Grok 3的订阅模式与未来规划

    Grok 3提供两种订阅模式:X平台Premium+深度用户和月费30美元/年费300美元的SuperGrok。xAI计划在一周内上线语音模式,数周后为企业用户提供包含DeepSearch的API接入方案,并在几个月后对Grok 2进行开源。

  4. Grok 3对Scaling Law的意义

    Grok 3的发布被视为对Scaling Law的又一次验证,其强大的算力支持(20万张英伟达GPU,4亿个GPU小时)远超其他模型,这表明在LLM领域,Scaling Laws或许依然成立。Grok 3的成功也挑战了“Scaling Law终结”的论调。

  5. Grok 3的市场竞争力与争议

    虽然Grok 3在技术上表现出色,但在市场竞争力方面仍面临挑战。其市场份额远不及ChatGPT,并且曾因访问X平台数据而产生偏见争议。一些观点认为,即使使用合成数据,Grok 3也难以与参数规模更大的竞争对手匹敌。然而,Grok 3与X平台的原生集成以及独特的编程方式使其在X用户中颇受欢迎。

  6. Grok系列模型的演进

    Grok系列模型是xAI的核心产品,从Grok 1的合成数据训练,到Grok 2的合成数据与真实数据结合,再到Grok 3的强大算力支持和推理能力集成,体现了xAI在AI模型发展上的持续改进和探索。

总而言之,Grok 3的发布是AI领域的一个重要,其强大的性能和独特的特性使其成为一个值得关注的竞争者。然而,其能否最终跻身全球顶级模型之列,还需要时间的检验。


联系作者

文章来源:AI前线
作者微信:
作者简介:面向AI爱好者、开发者和科学家,提供大模型最新资讯、AI技术分享干货、一线业界实践案例,助你全面拥抱AIGC。

阅读原文
© 版权声明
问小白满血版DeepSeek免费不限次数使用

相关文章

问小白满血版DeepSeek免费不限次数使用

暂无评论

暂无评论...