李沐老师回归B站!带着大模型创业成果填坑来了

AIGC动态6个月前发布 量子位
7 0 0

李沐老师回归B站!带着大模型创业成果填坑来了

AIGC动态欢迎阅读

原标题:李沐老师回归B站!带着大模型创业成果填坑来了
关键字:模型,基准,团队,量子,角色扮演
文章来源:量子位
内容字数:0字

内容摘要:


西风 发自 凹非寺量子位 | 公众号 QbitAI终于,AI大神李沐回来了!带着他的大模型创业最新成果——
一个专门为复杂场景角色扮演设计的大模型,名为Higgs-Llama-3-70B。
得知消息的不少网友已激动在评论区催更,李沐老师也回应,视频坑还是会填的:
想你的365天。
终于回来了,视频都盘包浆了。
那沐神到底干啥去了?这就透过Higgs-Llama-3-70B瞧一瞧。
定睛一看,Higgs-Llama-3-70B是沐神去年联合创立的公司Boson AI,推出的Higgs开源系列大模型中的第一个,基于Llama 3打造,做了完整的SFT、RLHF。
它不仅能在角色扮演任务上表现优异,在通用领域上的指令遵循和推理方面也很有竞争力。
另外还有市场消息称,Boson AI已获投资。
左击Claude3,右打Gemini团队在两个新基准测试MMLU-Pro和Arena-hard上展示了Higgs-Llama-3-70B的能力。
他们还特地强调所有基准测试终将导致过拟合,已尽量从微调数据中排除了基准测试数据及其训练示例。
具体来说,MMLU-Pro是MMLU的扩展,团队认为MMLU-P


原文链接:李沐老师回归B站!带着大模型创业成果填坑来了

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...