对话面壁智能李大海:Scaling Law 之外,大模型的另一条关键路径
AIGC动态欢迎阅读
原标题:对话面壁智能李大海:Scaling Law 之外,大模型的另一条关键路径
关键字:模型,华为,解读,知乎,智能
文章来源:Founder Park
内容字数:0字
内容摘要:
虽然 OpenAI 反复强调 Scaling Law 是大模型最重要的原则,但事实上,GPT-4 在过去一年里缩小了 10 倍。
这是面壁智能看到的,Scaling Law 的另一面。
基于对 Scaling Law 的独特理解,在 8B 的面壁小钢炮模型上,他们实现了可以和 GPT-4V 对标的多模态能力,甚至有信心在 2026 年推出一个 GPT-4 水平的端侧模型。
而在 Google 推出开源 Gemma 端侧模型,Apple 推出基于本地端侧模型的「苹果智能」后,端侧模型这个赛道突然也变得炙手可热起来。
为什么聚焦端侧,「一方面因为确实看到了端侧离用户最近,另一方面也是觉得端侧是落地起来更具象化、更现实的途径。」李大海是这么说的。
而如何做到离用户更近,在李大海看来,必须做到两点:
「需要分享尽可能多的上下文,更懂用户。」
「一定要能实现『三位一体』,就是感知、决策、行为。」
关于创业、关于端侧模型不一样的 Scaling Law,以及端侧模型和云端如何协同的未来,在 AGI Playground 2024 上,极客公园创始人 & 总裁张鹏与面壁智能联合创始人&CEO 李大海
原文链接:对话面壁智能李大海:Scaling Law 之外,大模型的另一条关键路径
联系作者
文章来源:Founder Park
作者微信:Founder-Park
作者简介:来自极客公园,专注与科技创业者聊「真问题」。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...