标签:架构
新架构超越Transformer?由CMU和普林斯顿联合推出,实现五倍推理速度提升并全面优化性能
大数据文摘受权转载自头部科技作者丨CongerryTransformer被挑战了!2017年6月,8位谷歌研究人员共同发表了一篇神作《Attention is All You Need》。之所以称...
五倍吞吐量,性能全面包围Transformer:新架构Mamba引爆AI圈
机器之心报道编辑:张倩、蛋酱屹立不倒的 Transformer 迎来了一个强劲竞争者。在别的领域,如果你想形容一个东西非常重要,你可能将其形容为「撑起了某领域的...
Transformer挑战者出现!斯坦福CMU联合团队,开源模型及代码,公司已创办
梦晨 发自 凹非寺量子位 | 公众号 QbitAI现在ChatGPT等大模型一大痛点:处理长文本算力消耗巨大,背后原因是Transformer架构中注意力机制的二次复杂度。Flash...
颠覆Transformer霸权!CMU普林斯顿推Mamba新架构,解决致命bug推理速度暴增5倍
新智元报道编辑:编辑部【新智元导读】诞生6周年的Transformer,霸主之位终于要被颠覆了?CMU、普林斯顿研究者发布的Mamba,解决了Transformer核心注意力层无...
人工智能基础创新的第二增长曲线
来源:微软亚洲研究院作者:韦福如编者按:2023年是微软亚洲研究院建院25周年。借此机会,我们特别策划了“智启未来”系列文章,邀请到微软亚洲研究院不同研究...
微软亚洲研究院韦福如:人工智能基础创新的第二增长曲线
机器之心专栏作者:韦福如本文为微软亚洲研究院全球研究合伙人韦福如的分享,讲述了他对人工智能、计算机及其交叉学科领域的观点洞察及前沿展望。从人工智能...
MAXIEYE 发布青云BEV架构,重塑自动驾驶底层思考 |甲子光年
高阶智驾的终极答卷。2023年11月29日,AI驱动的自动驾驶技术产品提供商——智驾科技MAXIEYE重磅召开主题为「虚实之间-BEV新范式和NOA真无图」的技术战略和新品...
大模型深入智慧之地,手机厂商会如何交卷?
受访嘉宾 | 刘海锋OPPO 数智工程事业部总裁作者 | 罗燕珊1一条新路出现:跟风与乘势?大模型浪潮下的未见与先见在蓬勃发展的 AI 浪潮中,各行各业似乎都在积...
Keras 3.0一统江湖!大更新整合PyTorch、JAX,全球250万开发者在用了
新智元报道编辑:编辑部【新智元导读】今天,备受广大开发者欢迎的深度学习框架Keras,正式更新了3.0版本,实现了对PyTorch和JAX的支持,同时性能提升,还能...
NVIDIA 大力支持 InfiniBand
点击上方蓝字关注我们“ NVIDIA最新的第三季度业绩表现出色,营收达到181.2亿美元,同比增长206%,季度环比增长34%。公司特别强调InfiniBand网络的贡献,其年...
智能的本质就是压缩?马毅团队5年心血提出「白盒」Transformer, 打开LLM黑盒!
新智元报道编辑:润 桃子【新智元导读】来自UC伯克利,港大等机构的研究人员,开创性地提出了一种「白盒」Transformer结构——CRATE。他们通过将数据从高维度分...
信仰的归信仰,商业的归商业|AGI是信仰的游戏,还是商业的操纵?|这场闹剧是GPT-5的内部觉醒,还是造物主的人性精妙设计?
点击上方蓝字关注我们图:在这个月初的一个视频访谈中,Ilya谈到最新的GPT进展给他最震惊的突破是:当和GPT对话时,有那种被理解的感觉。“Elon Musk在周末的O...