零一万物黄文灏：大模型训练方及Yi-Large的实践

AIGC动态2年前 (2024)发布智猩猩AGI

零一万物黄文灏：大模型训练方法论及Yi-Large的实践

AIGC动态欢迎阅读

原标题：零一万物黄文灏：大模型训练方及Yi-Large的实践
关键字：模型,知乎,数据,报告,腾讯
文章来源：智猩猩AGI
内容字数：0字

内容摘要：

9月6-7日，2024全球AI芯片峰会将在北京召开。目前，AMD人工智能事业部高级总监王宏强，清华大学交叉信息研究院助理教授、北极雄芯创始人马恺声，珠海芯动力创始人兼CEO李原，“吴文俊2023人工智能芯片专项奖”第一完、锋行致远创始人兼CEO孙唐等嘉宾已确认出席。欢迎报名或购票参会～原文：https://zhuanlan.zhihu.com/p/709900395
智源大会之后，一直想把当时的分享以文字的形式放到知乎上。但因为拖延症一直耽搁了（起初是去CVPR开会并且在硅谷待了一段时间，后面就纯粹是拖延症了）。好不容易有时间，就把这个债先还上。整个talk主要在high-level层面讨论方，没有太多的技术细节，大家就当看个乐子吧。01夸夸Yi-Large第一个part肯定是要夸一夸自己的模型，这里用了LMSYS的成绩。现在处于各个benchmark都被刷爆的状态，LMSYS似乎成为了相对客观的一个评价标准。它会更接近大多数用户的真实体感评测（可能有人会觉得它和自己的体感不一致，所以这里是大多数，肯定很难和每个人的体感是一致的）：
由用户自己提出问题，因此题目不是静态的，理论

原文链接：零一万物黄文灏：大模型训练方及Yi-Large的实践