标签:架构
网络架构如何支持超万卡的大规模 AI 训练?
演讲嘉宾 | 席永青 AI 训练场景的算力 Scaling 核心是网络,依赖于大规模、高性能的数据中心网络集群来实现算力的规模扩展,为此,阿里云设计了 HPN7.0 架构...
作为人工智能下一个关口的意识研究:从加扎尼加的意识学说切入
来源:神经现实 摘要随着近年来人工智能(AI)的惊人进步,AI 是否具有意识以及如何构建有意识的 AI 系统越来 越受到学界和公众的关注。要回答这类问题,我们...
AI手机PC大爆发,Arm从软硬件到生态发力,打造行业AI百宝箱
生成式AI,Arm抛出AI软硬件加速全家桶。 作者|云鹏 编辑|漠影 随着“Gen-AI”时代的到来,AI手机、AI PC等关键核心移动设备都在快速与生成式AI结合,越来越多的...
英特尔牙膏挤爆:功耗降40%、AI算力120TOPS,你的下一代笔记本没有内存条了
西风 发自 凹非寺量子位 | 公众号 QbitAI英特尔为了AI,再次做出重大架构变革: 像手机一样搞起SoC(系统级芯片),你的下一台笔记本不会再有独立内存条。 刚...
AMD提前发布新AI芯片,硬刚英伟达!Zen 5架构性能提高一倍
夕小瑶科技说 原创作者 | 海野眼看着英伟达要打破摩尔定律,开启一年一更的新时代;搭载高通骁龙新芯片的设备,也将于数日后上市。AMD这坐不住啊:这风头怎么...
老黄自己卷自己!GPU要一年更新一代!预告新动作:AI工厂将吞噬一切
夕小瑶科技说 原创作者 | 小戏 站在 AI 时代风口浪尖的弄潮儿英伟达又为大家带来了一场科技饕餮盛宴! 昨晚 7 点,坐标中国台湾大学体育场,英伟达 CEO 黄仁...
单GPU训练一天,Transformer在100位数字加法上就达能到99%准确率
机器之心报道 机器之心编辑部乘法和排序也有效。 自 2017 年被提出以来,Transformer 已成为 AI 大模型的主流架构,一直稳站 C 位。 但所有研究者都不得不承...
骁龙 8 Gen4 发布时间确定,小米或再次首发
骁龙 8 Gen4 全面升级 继高通去年十月发布骁龙 8 Gen3 后,已过去了三个季度。移动端的 9300 与 8 Gen3 之争,也随着本月最后一台 8 Gen3 超大杯发布而落下...
杨立昆教授关于通用人工智能世界模型JEPA观点及争议
-本篇附录杨立昆教授世界模型JEPA论文摘要简介和争议背景,全文将在下一篇播出,论文全文约有4.6万字。 目录 1世界模型JEPA观点及争议背景 2编译作者观...
MoE 高效训练的 A/B 面:与魔鬼做交易,用「显存」换「性能」
在高效训练与高显存占用之间横跳的 MoE,更像是一门妥协的艺术。作者|房晓楠 编辑|陈彩娴 MoE 会成为未来大模型训练的新方向吗? 这是人们发现 MoE 架构可...
Meta首席科学家:不要从事LLM研究!它已经被大公司主导
点击上方蓝字关注我们“摘要:在巴黎VivaTech科技盛会上,Meta AI首席Yann LeCun建议学生不要专注于大型语言模型(LLMs)的研究,并鼓励开发新一代人工智能系...
创业总结!大模型RAG系统三个月的开发心得和思考
直播预告 | 5月28日10点,「智猩猩AI新青年讲座」第236讲正式开讲,密歇根大学安娜堡分校在读博士生张挥杰将直播讲解《利用多级框架和多解码器架构提高扩散模...
Scaling Law的尽头是什么?|甲子引力X
大模型的“摩尔定律”。2024年5月15日,由中国科技产业智库「甲子光年」主办、中关村东升科学城协办的「AI创生时代——2024甲子引力X科技产业新风向」大会在北京...
利用多级框架和多解码器架构提高扩散模型训练效率 | 密歇根大学安娜堡分校在读博士张挥杰主讲
「智猩猩AI新青年讲座」由智猩猩出品,致力于邀请青年学者,主讲他们在生成式AI、LLM、AI Agent、CV等人工智能领域的最新重要研究成果。 AI新青年是加速人工...
英伟达股价首次破1000美元!黄仁勋:Token生意将创造100万亿价值
明敏 发自 凹非寺量子位 | 公众号 QbitAI英伟达股价,盘后首次冲破1000美元大关! 随着本财年第一季度财报公布,多项业绩数据超出预期。盘后英伟达股价暴涨6%...