AIGC动态欢迎阅读
原标题:兆级长文本,已是一线大模型机构标配能力丨上海AI Lab林达华
关键字:模型,林达,腾讯,能力,数据
文章来源:量子位
内容字数:5990字
内容摘要:
衡宇 发自 阿拉上海量子位 | 公众号 QbitAI“据我了解,国内多个一线大模型机构,都已经突破了兆级的长文本能力。”
以上,是“2024全球开发者先锋大会”大模型前沿论坛会间隙,上海人工智能实验室领军科学家林达华与量子位的交谈剪影。
林达华,深度学习与计算机专家,香港中文大学教授,他是商汤联合创始人,也是商汤创始人汤晓鸥的学生,是国际上最具影响力的视觉算法开源项目OpenMMLab的主导发起人。在大模型时代,他带领了书生·浦语InternLM开源大模型体系以及OpenCompass司南大模型评测体系的研发工作。
林达华预估,第一季度左右,各家都会对大模型上下文窗口兆级能力“亮剑”。
同时,他表达了与月之暗面同样的态度,即大海捞针其实没有那么难。
难的是海里不止一根针,应有无数的碎片化信息藏在各个地方,(大模型)把所有东西串接一起,做比较深层次的结论。就像读福尔摩斯侦探小说,读完后综合判断凶手是谁——这就不是一个简单的检索问题。
近期,各家大模型于长文本赛道上卷生卷死,但是否应把它作为最主要的方向去打磨,大家有不同的判断。
林达华点出,应该要评估衡量超长文本能力的计算代价,“无损长上
原文链接:兆级长文本,已是一线大模型机构标配能力丨上海AI Lab林达华
联系作者
文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...