腾讯最新万亿参数异构MoE上线,技术细节首次曝光!权威评测国内第一,直逼GPT-4o

腾讯最新万亿参数异构MoE上线,技术细节首次曝光!权威评测国内第一,直逼GPT-4o

AIGC动态欢迎阅读

原标题:腾讯最新万亿参数异构MoE上线,技术细节首次曝光!权威评测国内第一,直逼GPT-4o
关键字:腾讯,模型,能力,报告,解读
文章来源:新智元
内容字数:0字

内容摘要:


新智元报道编辑:桃子 好困
【新智元导读】鹅厂新一代旗舰大模型混元Turbo技术报告首次曝光。模型采用全新分层异构的MoE架构,总参数达万亿级别,性能仅次于GPT-4o,位列国内第一梯队。近期,腾讯混元推出新一代旗舰大模型——混元Turbo。
作为国内率先采用MoE结构大模型的公司,腾讯继续在这一技术路线上进行技术创新。
相较上一代混元Pro的同构MoE大模型结构,混元Turbo采用了全新的分层异构MoE结构,在参数总规模上依然保持万亿级。
公开信息显示,当前混元Turbo模型在业界公认的benchmark指标上处于国内行业领先地位,与国外头部模型如GPT-4o等相比也处于第一梯队。
另外,在刚刚发布的国内第三方权威评测机构评测中,混元Turbo模型位列国内第一。混元Turbo是如何做到如此快速的进步?
背后技术细节首公开我们拿到了混元Turbo的技术解读,从Pretrain、Postrain和专项能力突破几个角度,深入展示了模型升级的秘密。
首先,业界目前普遍公认,大模型Pretrain成功的关键秘诀之一是Scaling Law。
可以简单理解为,训练数据量越大,模型效果越好;参数


原文链接:腾讯最新万亿参数异构MoE上线,技术细节首次曝光!权威评测国内第一,直逼GPT-4o

联系作者

文章来源:新智元
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...