标签:架构

新架构超越Transformer?由CMU和普林斯顿联合推出,实现五倍推理速度提升并全面优化性能

大数据文摘受权转载自头部科技作者丨CongerryTransformer被挑战了!2017年6月,8位谷歌研究人员共同发表了一篇神作《Attention is All You Need》。之所以称...
阅读原文

五倍吞吐量,性能全面包围Transformer:新架构Mamba引爆AI圈

机器之心报道编辑:张倩、蛋酱屹立不倒的 Transformer 迎来了一个强劲竞争者。在别的领域,如果你想形容一个东西非常重要,你可能将其形容为「撑起了某领域的...
阅读原文

Transformer挑战者出现!斯坦福CMU联合团队,开源模型及代码,公司已创办

梦晨 发自 凹非寺量子位 | 公众号 QbitAI现在ChatGPT等大模型一大痛点:处理长文本算力消耗巨大,背后原因是Transformer架构中注意力机制的二次复杂度。Flash...
阅读原文

颠覆Transformer霸权!CMU普林斯顿推Mamba新架构,解决致命bug推理速度暴增5倍

新智元报道编辑:编辑部【新智元导读】诞生6周年的Transformer,霸主之位终于要被颠覆了?CMU、普林斯顿研究者发布的Mamba,解决了Transformer核心注意力层无...
阅读原文

当苹果芯片跌落神坛

安卓芯逆袭苹果的秘密,藏在这20年里。作者|云鹏编辑|心缘最近国内安卓阵营迎来了一波接一波的新机发布热潮,而在各家发布会上,苹果A17 Pro着实成了“常客”,...
阅读原文

人工智能基础创新的第二增长曲线

来源:微软亚洲研究院作者:韦福如编者按:2023年是微软亚洲研究院建院25周年。借此机会,我们特别策划了“智启未来”系列文章,邀请到微软亚洲研究院不同研究...
阅读原文

微软亚洲研究院韦福如:人工智能基础创新的第二增长曲线

机器之心专栏作者:韦福如本文为微软亚洲研究院全球研究合伙人韦福如的分享,讲述了他对人工智能、计算机及其交叉学科领域的观点洞察及前沿展望。从人工智能...
阅读原文

MAXIEYE 发布青云BEV架构,重塑自动驾驶底层思考 |甲子光年

高阶智驾的终极答卷。2023年11月29日,AI驱动的自动驾驶技术产品提供商——智驾科技MAXIEYE重磅召开主题为「虚实之间-BEV新范式和NOA真无图」的技术战略和新品...
阅读原文

大模型深入智慧之地,手机厂商会如何交卷?

受访嘉宾 | 刘海锋OPPO 数智工程事业部总裁作者 | 罗燕珊1一条新路出现:跟风与乘势?大模型浪潮下的未见与先见在蓬勃发展的 AI 浪潮中,各行各业似乎都在积...
阅读原文

Keras 3.0一统江湖!大更新整合PyTorch、JAX,全球250万开发者在用了

新智元报道编辑:编辑部【新智元导读】今天,备受广大开发者欢迎的深度学习框架Keras,正式更新了3.0版本,实现了对PyTorch和JAX的支持,同时性能提升,还能...
阅读原文

NVIDIA 大力支持 InfiniBand

点击上方蓝字关注我们“ NVIDIA最新的第三季度业绩表现出色,营收达到181.2亿美元,同比增长206%,季度环比增长34%。公司特别强调InfiniBand网络的贡献,其年...
阅读原文

智能的本质就是压缩?马毅团队5年心血提出「白盒」Transformer, 打开LLM黑盒!

新智元报道编辑:润 桃子【新智元导读】来自UC伯克利,港大等机构的研究人员,开创性地提出了一种「白盒」Transformer结构——CRATE。他们通过将数据从高维度分...
阅读原文

信仰的归信仰,商业的归商业|AGI是信仰的游戏,还是商业的操纵?|这场闹剧是GPT-5的内部觉醒,还是造物主的人性精妙设计?

点击上方蓝字关注我们图:在这个月初的一个视频访谈中,Ilya谈到最新的GPT进展给他最震惊的突破是:当和GPT对话时,有那种被理解的感觉。“Elon Musk在周末的O...
阅读原文

别再声讨零一万物了

Transformer 时代,重复造轮子或是AI爆发的最大阻碍。作者 | 陈彩娴编辑 | 岑 峰最近两天,由原阿里技术副总裁、深度学习框架 Caffe 发明者贾扬清一则朋友圈...
阅读原文

大模型架构创新已死?

三石 白交发自 凹非寺量子位 | 公众号 QbitAI一场围绕大模型自研和创新的讨论,这两天在技术圈里炸了锅。起初,前阿里技术VP贾扬清,盆友圈爆料吐槽:有大厂...
阅读原文
11011121314