一群顶尖搜索人才如何2个月出货，还把GPU利用率干到60%！揭秘百川智能研发大模型这一年

AIGC动态2年前 (2024)发布 AI前线

AIGC动态欢迎阅读

原标题：一群顶尖搜索人才如何2个月出货，还把GPU利用率干到60%！揭秘百川智能研发大模型这一年
关键字：模型,腾讯,华为,快手,能力
文章来源：AI前线
内容字数：0字

内容摘要：

作者｜褚杏娟采访嘉宾｜陈炜鹏
去年的大模型之战讲究一个“快”字：入场快、发布快、迭代快。
王小川在去年 4 月份宣布成立“百川智能”的两个月后，就迅速对外推出了 70 亿参数量的中英文预训练大模型 Baichuan 7B。一年多后的今天，百川智能已经将大模型迭代到了 Baichuan 4。
曾担任搜狗搜索研发总经理的陈炜鹏如今在百川智能负责模型研发，这对他来讲也是一次挑战。“搜索与模型研发有很大的不同，研发经验不一定能完全复刻，比如两者对数据的定义可能完全不一样。”
但陈炜鹏也表示，做搜索和大模型也有共性，就是它们都是系统性工程。“在大模型之前，被认为系统性工程的算法问题只有三个：搜索系统、推荐系统和广告系统。以前的搜索经验让我知道怎么样解决一个系统性的问题。”
实际上，百川智能的技术团队可以分为两部分：一部分是像陈炜鹏这样有很强系统性工程经验的人，他们做过复杂的项目，知道怎样把复杂的问题拆解成为子问题，然后做有效的科学管理；另一部分则是对语言模型本身有很好认知的研发人员。
“大模型的研发不是一个单点问题，而是一个系统问题。解决系统性问题，是我们团队的优势。”陈炜鹏说道。那百川智能（

原文链接：一群顶尖搜索人才如何2个月出货，还把GPU利用率干到60%！揭秘百川智能研发大模型这一年