阶跃星辰崛起：超越 GPT-4o 与 Gemini-1.5，夺得中国大模型王者之冠！

LiveBench 榜单比拼，只有一家中国大模型进入前十。

原标题：超越 GPT-4o 和 Gemini-1.5，阶跃星辰拿下中国大模型第一
文章来源：AI科技评论
内容字数：6885字

根据最新的LiveBench榜单，中国大模型公司阶跃星辰的万亿参数语言模型Step-2成功跻身全球前十，成为唯一进入榜单前十的国产大语言模型，位列全球第五。此成绩不仅反映了阶跃星辰在大模型技术领域的实力，也为国内大模型的发展注入了信心。

LiveBench被誉为“世界上第一个不可玩弄的LLM基准测试”，由著名AI科学家杨立昆等机构联合推出。该榜单评估模型的多维度能力，涵盖数学、推理、编程等18项任务，确保评估的权威性和公正性。为了避免数据污染，LiveBench每月更新问题，确保测试的严谨性和挑战性。

在榜单中，Step-2在指令跟随（IF Average）方面表现优异，以86.57的高分位列第一，超越包括OpenAI的o1-mini等国际主流模型。该模型不仅能够生成高质量的文本，还能精确地执行用户指令，体现出强大的理解和推理能力，满足复杂的用户需求。

阶跃星辰在万亿参数模型的开发上取得了显著进展，Step-2采用了MoE架构，突破了多项关键技术，具备强大的系统能力。除了语言模型，阶跃星辰还推出了多模态模型Step-1.5V，具备视频理解和图像识别能力，能够处理复杂图文信息，满足各类应用需求。

基于Step-2的技术，阶跃星辰推出的跃问APP具备智能视觉搜索功能“拍照问”，可以解决用户在文字和语音描述中的难题。随着底层模型的不断优化和产品能力的提升，阶跃星辰在大模型领域的未来充满希望。

阶跃星辰通过LiveBench榜单的优异表现，不仅向行业展示了其大模型技术的实力，也为国内大模型的发展树立了标杆。随着技术的不断进步和产品的创新，阶跃星辰正在朝着更高的目标迈进，展望未来，期待其在智能助手和多模态领域的进一步突破。

文章来源：AI科技评论
作者微信：
作者简介：雷峰网旗下AI新媒体。聚焦AI前沿研究，关注AI工程落地。

文章版权归作者所有，未经允许请勿转载。

暂无评论...