AIGC动态欢迎阅读
原标题:对话360集团梁志辉:360是如何做大模型的?|甲子光年
文章来源:甲子光年
内容字数:18998字
内容摘要:1个千亿的大模型+N个百亿小模型的部署方式或许是最优路线。作者|苏霍伊编辑|赵健明天,是 ChatGPT 问世一周年的日子。过去的一年时间已证明,AI 大模型并不是泡沫,作为新一代的生产力工具,它将成为数字化系统的标配,赋能产业数字化发展。大模型的最显著特征在于其庞大的规模,参数规模通常会达到百亿、千亿,甚至万亿级别。为了更高效地运行这些大模型,算力集群已经升级到“万卡”级别。但是,当有些人在追求更大参数规模的同时,另一些人则希望把大模型“做小”。普林斯顿大学计算机科学系助理教授陈丹琦在 2022 年智源大会上就发表了“Making large models smaller(让大模型变小)”主题报告。2023 年 5 月,Google 在 I/O 发布者大会公布了AI 大计划:让大模型变小、嵌入每一个产品。而在国内企业界,360 集团创始人周鸿祎的观点极具代表性。在 2023 …
原文链接:点此阅读原文:对话360集团梁志辉:360是如何做大模型的?|甲子光年
联系作者
文章来源:甲子光年
作者微信:jazzyear
作者简介:甲子光年是一家科技智库,包含智库、社群、企业服务版块,立足中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,推动人工智能、大数据、物联网、云计算、新能源、新材料、信息安全、大健康等科技创新在产业中的应用与落地。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...