失联大神李沐B站复更：领读Llama 3.1论文，还多讲了一点AI八卦；大模型竞技场Llama 3.1排名第三

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：失联大神李沐B站复更：领读Llama 3.1论文，还多讲了一点AI八卦；大模型竞技场Llama 3.1排名第三
关键字：网友,模型,小哥,竞技场,论文
文章来源：量子位
内容字数：0字

内容摘要：

一水发自凹非寺量子位 | 公众号 QbitAIAI大神李沐老师时隔1年多，终于回归B站“填坑”经典论文精读系列了！
没错，最新主角儿还是Llama-3.1：
在这个18分钟左右的视频中，李沐老师手把手教我们读Llama-3.1技术论文，甚至还爆料了一些八卦。（指路7分50秒左右）
他提到，Llama团队在训练最大模型时，其实一开始同时训练了MoE模型和稠密模型，但是前者后来失败了，所以最后只发了一个简单版本。
更多细节大家可以去看原视频，悄透露，李沐老师刚一上线，播放瞬间破万了。
一大批研究僧们正闻风赶来，瞧瞧热一就知道大家的精神状态了：
（视频地址在文末领取）
与此同时，大模型竞技场排名更新，Llama-3.1-405B代表开源模型首次跻身竞技场前三，仅次于GPT-4o和Claude-3.5-Sonnet。
当然了，这一结果可能并不意外，Meta官方早就暗戳戳地将这几个作了一番比较。
同样是人类评估，Llama-3.1-405B和另外两个打得不分上下。
另外我们看到，Llama-3.1-405B不仅整体能打，在单项（编码、数学、指令遵循、硬提示）中依然牢牢占据前三。
值得一提

原文链接：失联大神李沐B站复更：领读Llama 3.1论文，还多讲了一点AI八卦；大模型竞技场Llama 3.1排名第三