一群顶尖搜索人才如何2个月出货,还把GPU利用率干到60%!揭秘百川智能研发大模型这一年

AIGC动态3个月前发布 AI前线
4 0 0

一群顶尖搜索人才如何2个月出货,还把GPU利用率干到60%!揭秘百川智能研发大模型这一年

AIGC动态欢迎阅读

原标题:一群顶尖搜索人才如何2个月出货,还把GPU利用率干到60%!揭秘百川智能研发大模型这一年
关键字:模型,腾讯,华为,快手,能力
文章来源:AI前线
内容字数:0字

内容摘要:


作者|褚杏娟 采访嘉宾|陈炜鹏
去年的大模型之战讲究一个“快”字:入场快、发布快、迭代快。
王小川在去年 4 月份宣布成立“百川智能”的两个月后,就迅速对外推出了 70 亿参数量的中英文预训练大模型 Baichuan 7B。一年多后的今天,百川智能已经将大模型迭代到了 Baichuan 4。
曾担任搜狗搜索研发总经理的陈炜鹏如今在百川智能负责模型研发,这对他来讲也是一次挑战。“搜索与模型研发有很大的不同,研发经验不一定能完全复刻,比如两者对数据的定义可能完全不一样。”
但陈炜鹏也表示,做搜索和大模型也有共性,就是它们都是系统性工程。“在大模型之前,被认为系统性工程的算法问题只有三个:搜索系统、推荐系统和广告系统。以前的搜索经验让我知道怎么样解决一个系统性的问题。”
实际上,百川智能的技术团队可以分为两部分:一部分是像陈炜鹏这样有很强系统性工程经验的人,他们做过复杂的项目,知道怎样把复杂的问题拆解成为子问题,然后做有效的科学管理;另一部分则是对语言模型本身有很好认知的研发人员。
“大模型的研发不是一个单点问题,而是一个系统问题。解决系统性问题,是我们团队的优势。”陈炜鹏说道。那百川智能(


原文链接:一群顶尖搜索人才如何2个月出货,还把GPU利用率干到60%!揭秘百川智能研发大模型这一年

联系作者

文章来源:AI前线
作者微信:ai-front
作者简介:面向AI爱好者、开发者和科学家,提供大模型最新资讯、AI技术分享干货、一线业界实践案例,助你全面拥抱AIGC。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...