对话360集团梁志辉：360是如何做大模型的？｜甲子光年

AIGC动态3年前 (2023)发布甲子光年

AIGC动态欢迎阅读

原标题：对话360集团梁志辉：360是如何做大模型的？｜甲子光年

关键字：模型,甲子,报告,能力,问题

文章来源：甲子光年

内容字数：18998字

内容摘要：1个千亿的大模型+N个百亿小模型的部署方式或许是最优路线。作者｜苏霍伊‍‍‍编辑｜赵健‍‍‍明天，是 ChatGPT 问世一的日子。过去的一年时间已证明，AI 大模型并不是泡沫，作为新一代的生产力工具，它将成为数字化系统的标配，赋能产业数字化发展。大模型的最显著特征在于其庞大的规模，参数规模通常会达到百亿、千亿，甚至万亿级别。为了更高效地运行这些大模型，算力集群已经升级到“万卡”级别。但是，当有些人在追求更大参数规模的同时，另一些人则希望把大模型“做小”。普林斯顿大学计算机科学系助理教授陈丹琦在 2022 年智源大会上就发表了“Making large models smaller（让大模型变小）”主题报告。2023 年 5 月，Google 在 I/O 发布者大会公布了AI 大计划：让大模型变小、嵌入每一个产品。而在国内企业界，360 集团创始人周鸿祎的观点极具代表性。在 2023 …

原文链接：点此阅读原文：对话360集团梁志辉：360是如何做大模型的？｜甲子光年