腾讯最新万亿参数异构MoE上线，技术细节首次曝光！权威评测国内第一，直逼GPT-4o

AIGC动态2年前 (2024)发布新智元

AIGC动态欢迎阅读

原标题：腾讯最新万亿参数异构MoE上线，技术细节首次曝光！权威评测国内第一，直逼GPT-4o
关键字：腾讯,模型,能力,报告,解读
文章来源：新智元
内容字数：0字

内容摘要：

新智元报道编辑：桃子好困
【新智元导读】鹅厂新一代旗舰大模型混元Turbo技术报告首次曝光。模型采用全新分层异构的MoE架构，总参数达万亿级别，性能仅次于GPT-4o，位列国内第一梯队。近期，腾讯混元推出新一代旗舰大模型——混元Turbo。
作为国内率先采用MoE结构大模型的公司，腾讯继续在这一技术路线上进行技术创新。
相较上一代混元Pro的同构MoE大模型结构，混元Turbo采用了全新的分层异构MoE结构，在参数总规模上依然保持万亿级。
公开信息显示，当前混元Turbo模型在业界公认的benchmark指标上处于国内行业领先地位，与国外头部模型如GPT-4o等相比也处于第一梯队。
另外，在刚刚发布的国内第三方权威评测机构评测中，混元Turbo模型位列国内第一。混元Turbo是如何做到如此快速的进步？
背后技术细节首公开我们拿到了混元Turbo的技术解读，从Pretrain、Postrain和专项能力突破几个角度，深入展示了模型升级的秘密。
首先，业界目前普遍公认，大模型Pretrain成功的关键秘诀之一是Scaling Law。
可以简单理解为，训练数据量越大，模型效果越好；参数