年底基座大模型轮番炸场,谁是“多模态之王”?|甲子光年

多模态语音、视觉理解及生成火力全开。

年底基座大模型轮番炸场,谁是“多模态之王”?|甲子光年

原标题:年底基座大模型轮番炸场,谁是“多模态之王”?|甲子光年
文章来源:甲子光年
内容字数:8195字

阶跃星辰:多模态大模型领跑者,AGI之路上的坚定探索

本文主要讲述了AI创业公司阶跃星辰在2025年开年发布多款大模型,展现其在多模态领域的技术实力和对AGI的坚定追求。

1. 基座大模型的生存挑战与阶跃星辰的坚持

2023年,基座大模型曾是AI创业公司的焦点,但不到两年时间,许多公司面临融资难题、技术与产品选择困境以及商业模式验证等挑战。一些公司选择与大厂合作,转向更小规模、更垂直领域的模型开发。然而,阶跃星辰、智谱等少数公司依然坚持自研基座大模型,并在融资方面表现出色。阶跃星辰在B轮融资后,加速了AGI研发进程,2025年开年发布6款新模型,展现了其强大的研发能力和对基座大模型的坚定信念。

2. 阶跃星辰的多模态大模型家族:Step系列的全面升级

阶跃星辰的Step系列大模型,以其多模态能力著称。此次发布的六款新模型中,Step-1o系列最为引人注目,它融合了语音、文本、视觉三种模态,并在LMSYS和OpenCompass榜单上获得双料国产大模型第一。Step-1o Audio是国内首个千亿参数端到端语音大模型;Step-1o Vision在视觉感知和识别方面表现出色,同样获得多模态榜单冠军;升级后的Step-Video V2在视频生成方面取得了显著进步,其在物理合理性、空间感知和人物刻画等方面效果亮眼。此外,Step R-mini推理模型也实现了多模态场景的推理能力;Step-2 mini和Step文学大师版则在语言模型方面进一步提升了性能和应用便捷性。

3. Step系列模型的技术亮点

Step-1o系列模型实现了原生端到端文本、视觉、语音三模态生成理解一体化。Step-2 mini通过自研的新型注意力机制MFA,实现了更快的生成速度和更低的成本。Step-2文学大师版则专注于创作,避免了“AI味儿”的通病,更贴近真实的文学风格。Step R-mini推理模型则引入了“慢思考”机制,能够处理更复杂的推理问题,并拓展到视觉推理领域。

4. 大模型的下半场:洗牌与AGI的远景

文章认为,2025年是基座大模型的洗牌之年。海外市场已经形成寡头垄断,国内市场也面临着激烈的竞争。阶跃星辰坚持其AGI技术路线图,持续迭代全类别基模,展现了其技术理想主义和稳健的发展策略。创始人姜大昕认为,多模态融合和Scaling Law是实现AGI的关键。阶跃星辰的持续努力,为其在AGI的竞争中赢得了先机。

总而言之,阶跃星辰凭借其强大的多模态技术实力和对AGI的坚定信念,在竞争激烈的AI大模型领域脱颖而出,成为国内多模态大模型的领跑者。


联系作者

文章来源:甲子光年
作者微信:
作者简介:甲子光年是一家科技智库,包含智库、社群、企业服务版块,立足中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,推动人工智能、大数据、物联网、云计算、新能源、新材料、信息安全、大健康等科技创新在产业中的应用与落地。

阅读原文
© 版权声明
问小白满血版DeepSeek免费不限次数使用

相关文章

问小白满血版DeepSeek免费不限次数使用

暂无评论

暂无评论...