刚开年,大模型厂商就开始「卷」起来了。
原标题:昆仑万维「天工4.0」携超强o1/4o霸气上线!强推理+实时语音,免费无限体验
文章来源:机器之心
内容字数:10137字
大模型发展范式转移:推理能力成未来
1. **预训练时代走向终结?**: 文章指出,Ilya Sutskever在NeurIPS大会上预测,大模型的Scaling Law正在放缓,预训练时代即将结束,未来研究将更注重推理能力的提升。国内外许多从业者也观察到类似趋势,训练的Scaling Law放缓,但基于慢思考的推理Scaling Law开始涌现。
2. **多模态融合成大势所趋**: 随着大模型应用范围扩大,单一模态的局限性日益明显,多模态融合成为提升用户体验的关键。然而,国内能同时注重推理能力提升和多模态融合的公司并不多。
3. **昆仑万维:推理和多模态双线并进**: 昆仑万维是少数同时推进两条路线的公司之一。其发布的天工大模型4.0 o1 (Skywork o1)专注于推理能力,而天工大模型4.0 4o (Skywork 4o)则侧重语音对话能力,并已全量免费上线。
Skywork o1: 强大的推理能力
4. **Skywork o1 的优异表现**: Skywork o1 在数学、代码等领域的基准测试中取得了令人瞩目的成绩,例如在AMC-23、AIME-24等数学竞赛中达到或接近SOTA水平,在HumanEval和MBPP代码测试中也表现出色。其在自定义的推理能力评估集上也显著优于常规通用大模型。
5. **全方位推理能力测试**: 文章通过“海龟汤”、“过河”问题、“真话者与说谎者”、公务员行测类比推理题以及考研数学题等案例,展示了Skywork o1强大的多类型推理能力,包括发散性思维、逻辑推理、问题拆解、逆向思维、信息整合与分析等。
Skywork o1 的训练方法
6. **三阶段训练方案**: Skywork o1 的强大推理能力源于其独特的三阶段训练方案:第一阶段,通过自研多智能体体系构造高质量推理数据进行预训练和微调;第二阶段,使用自研的Skywork o1 Process Reward Model (PRM)进行强化学习,提升推理能力;第三阶段,基于自研的Q*算法进行推理规划,优化搜索路径。
Skyo: 逼真的语音对话AI助手
7. **Skyo 的优势**: Skyo 利用端到端建模,实现了低延迟、可打断、音真、情感丰富的语音对话体验,其在情绪感知和情感共鸣方面也表现出色。
8. **端到端建模的优势**: Skyo 的端到端建模方案避免了传统ASR+NLU+TTS级联方案的缺陷,使其能够像真人一样进行自然流畅的语音对话。
2025年大模型竞争新阶段
9. **未来发展趋势**: 文章预测2025年大模型竞争将进入新的阶段,关键词包括推理能力、AI智能体、空间智能和AI应用。 要做好AI智能体,需要强大的推理能力;要做好空间智能和AI应用,需要强大的多模态能力。
10. **昆仑万维的优势和未来展望**: 昆仑万维在推理和多模态大模型方面均有布局,并已取得了一些应用成果,这使其在通往AGI的道路上更具信心。 文章最后展望了昆仑万维在AI领域的未来发展。
联系作者
文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台