零一万物黄文灏:大模型训练方法论及Yi-Large的实践

零一万物黄文灏:大模型训练方法论及Yi-Large的实践

AIGC动态欢迎阅读

原标题:零一万物黄文灏:大模型训练方法论及Yi-Large的实践
关键字:模型,知乎,数据,报告,腾讯
文章来源:智猩猩AGI
内容字数:0字

内容摘要:


9月6-7日,2024全球AI芯片峰会将在北京召开。目前,AMD人工智能事业部高级总监王宏强,清华大学交叉信息研究院助理教授、北极雄芯创始人马恺声,珠海芯动力创始人兼CEO李原,“吴文俊2023人工智能芯片专项奖”第一完成人、锋行致远创始人兼CEO孙唐等嘉宾已确认出席。欢迎报名或购票参会~原文:https://zhuanlan.zhihu.com/p/709900395
智源大会之后,一直想把当时的分享以文字的形式放到知乎上。但因为拖延症一直耽搁了(起初是去CVPR开会并且在硅谷待了一段时间,后面就纯粹是拖延症了)。好不容易有时间,就把这个债先还上。整个talk主要在high-level层面讨论方法论,没有太多的技术细节,大家就当看个乐子吧。01夸夸Yi-Large第一个part肯定是要夸一夸自己的模型,这里用了LMSYS的成绩。现在处于各个benchmark都被刷爆的状态,LMSYS似乎成为了相对客观的一个评价标准。它会更接近大多数用户的真实体感评测(可能有人会觉得它和自己的体感不一致,所以这里是大多数,肯定很难和每个人的体感是一致的):
由用户自己提出问题,因此题目不是静态的,理论


原文链接:零一万物黄文灏:大模型训练方法论及Yi-Large的实践

联系作者

文章来源:智猩猩AGI
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...