阿里团队开源Marco-o1推理模型~
原标题:阿里Marco-o1推理大模型技术报告解读
文章来源:智猩猩GenAI
内容字数:9586字
2024中国生成式AI大会(上海站)预告
2024中国生成式AI大会将于12月5日至6日在上海举办,届时将有40多位嘉宾参与演讲,包括北大(临港)大模型对齐中心执行主任徐骅、腾讯优图实验室天衍研究中心负责人吴贤等。大会将设有“主会场峰会”、“分会场研讨会”及“展览区”,涵盖大模型、AI基础设施及生成式AI等多个主题。
Marco-o1模型的介绍
在OpenAI推出的o1模型基础上,阿里研究团队发布了Marco-o1推理模型,旨在增强大型语言模型(LLM)的推理能力。Marco-o1采用思维链(CoT)微调、蒙特卡洛树搜索(MCTS)及反思机制,致力于解决复杂的现实问题。
主要特点
1. **CoT数据微调**:Marco-o1通过多种数据集进行监督微调,显著提升了推理能力。
2. **MCTS扩展解空间**:结合LLM与MCTS,扩大了解决方案空间,提高模型在复杂问题上的表现。
3. **推理行动策略**:实施细粒度的推理策略及反思机制,增强了模型解决复杂问题的能力。
4. **机器翻译应用**:首次将大型推理模型应用于机器翻译,探索了翻译领域的推理时间缩放规律。
MCTS与CoT的结合
Marco-o1使用蒙特卡洛树搜索(MCTS)算法,通过节点代表推理状态,LLM输出作为行动,扩展搜索路径。利用置信度得分指导MCTS,进一步提高了推理质量。
实验结果
在MGSM数据集中,经过微调的Marco-o1-CoT模型在多语言小学数学问题的解决上表现优于基线模型,但在中文数据集上效果有所下降。机器翻译任务中,Marco-o1展现了其对上下文的理解能力,提供了更准确的翻译结果。
总结
Marco-o1模型的推出代表了生成式AI领域的新进展,通过多项技术创新,提升了推理能力和应用广度。此次大会将为与会者提供一个深入了解生成式AI前沿技术的机会,欢迎大家踊跃报名参加。
联系作者
文章来源:智猩猩GenAI
作者微信:
作者简介:智猩猩旗下矩阵账号之一,聚焦大模型开启的通用人工智能浪潮。