大模型疯狂 Rush，上海 AI Lab 回归语言建模本质

AIGC动态3年前 (2024)发布 AI科技评论

AIGC动态欢迎阅读

原标题：大模型疯狂 Rush，上海 AI Lab 回归语言建模本质
关键字：模型,能力,数据,人工智能,实验室
文章来源：AI科技评论
内容字数：12928字

内容摘要：

做大模型，还是要回归到难且价值大的事情上去。作者丨王悦
编辑丨陈彩娴
2023 年，是国内外大模型疯狂 rush 的一年。
在这场白热化的竞争中，大模型过剩带来的市场挤压感正时刻提醒着参与者所面临的行业洗牌风险。各厂商深知，基础通用大模型，注定是少数人的游戏。
为了赢得这场游戏，各家大模型多以一月四次的频率飞速迭代自身产品。这么做的原因，无非是看中冲在前面的先发优势——这可以在一定的商业周期中，与后来者拉开不小的距离。
加之数据上的“飞轮效应”，更早应用、更多用户的大模型，具备更高的市场打开度。
诚然，更靠前的身位的确重要，但过度地重视速度，则容易忽略大模型落地所需要的长周期、重基建和工程化难度——底层基础尚不坚固就匆匆在此基础上搭建高楼，其效果往往是「基础不牢，地动山摇」。
虽说如此做法也可以营造繁荣的表象，成功地将模型的成绩在某些特定的方面提上来，且在评测榜单中处于一个比较不错的位置，但其背后，则更多地依靠专项调优的方法，潜力十分有限。
经过市场的狂热期，整个行业意识到，还是要更多地关注基础能力是否真正取得了进步。
不同于商业化的大模型厂商，上海人工智能实验室在这场角逐中则稳定地

原文链接：大模型疯狂 Rush，上海 AI Lab 回归语言建模本质