李沐老师回归B站！带着大模型创业成果填坑来了

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：李沐老师回归B站！带着大模型创业成果填坑来了
关键字：模型,基准,团队,量子,角色扮演
文章来源：量子位
内容字数：0字

内容摘要：

西风发自凹非寺量子位 | 公众号 QbitAI终于，AI大神李沐回来了！带着他的大模型创业最新成果——
一个专门为复杂场景角色扮演设计的大模型，名为Higgs-Llama-3-70B。
得知消息的不少网友已激动在评论区催更，李沐老师也回应，视频坑还是会填的：
想你的365天。
终于回来了，视频都盘包浆了。
那沐神到底干啥去了？这就透过Higgs-Llama-3-70B瞧一瞧。
定睛一看，Higgs-Llama-3-70B是沐神去年联合创立的公司Boson AI，推出的Higgs开源系列大模型中的第一个，基于Llama 3打造，做了完整的SFT、RLHF。
它不仅能在角色扮演任务上表现优异，在通用领域上的指令遵循和推理方面也很有竞争力。
另外还有市场消息称，Boson AI已获投资。
左击Claude3，右打Gemini团队在两个新基准测试MMLU-Pro和Arena-hard上展示了Higgs-Llama-3-70B的能力。
他们还特地强调所有基准测试终将导致过拟合，已尽量从微调数据中排除了基准测试数据及其训练示例。
具体来说，MMLU-Pro是MMLU的扩展，团队认为MMLU-P

原文链接：李沐老师回归B站！带着大模型创业成果填坑来了