国产模型崛起！全球最强「最难作弊」大模型新榜单揭秘

Passion！

原标题：国产模型指令跟随全球第一！来自LeCun亲推的「最难作弊」大模型新榜单
文章来源：量子位
内容字数：6472字

近期，国内初创公司阶跃星辰旗下的万亿参数语言大模型Step-2在全球AI模型评测榜单LiveBench中表现优异，成为国内第一、全球第五的模型。这一成就引起了业界的广泛关注，标志着中国在大模型领域的崭露头角。

LiveBench由图灵奖得主杨立昆及纽约大学等机构共同推出，旨在提供一个无法作弊的LLM基准测试。在该榜单中，阶跃星辰的Step-2以57.68分的全球平均分位列榜单第五，成为唯一的国产模型，显示出其强大的技术实力。

Step-2在指令跟随任务中表现出色，以86.57的高分获得全球第一。这表明其在语言生成和理解能力上具有极强的控制力，能准确把握用户的模糊指令，展现出卓越的内容创作能力。该模型采用MoE架构，通过从头开始训练，确保参数的充分激活和高效利用。

除了语言模型，阶跃星辰还有多模态模型Step-1.5V，具备优异的图文理解和推理能力。该模型能够处理复杂的图表和视频内容，展现出其在多模态理解方面的突破。阶跃星辰明确了通往AGI的路线图，致力于开发能够实现AGI的多模态大模型。

随着技术的不断进步和产品的快速迭代，阶跃星辰有潜力成为大模型领域的重要参与者。其Step系列模型的成功不仅提升了公司的知名度，也为中国的大模型发展注入了新的动力。未来，阶跃星辰将继续推动技术创新，助力AI应用的广泛落地。

总之，阶跃星辰通过Step-2的成功，展现了中国在大模型领域的实力和潜力，值得期待其未来的发展。通过不断的创新和技术突破，阶跃星辰将为推动AGI的实现贡献重要力量。

文章来源：量子位
作者微信：
作者简介：追踪人工智能新趋势，关注科技行业新突破

文章版权归作者所有，未经允许请勿转载。

暂无评论...