标签:架构

「地表最快」 AI 芯片发布,哈佛辍学的本科生挑战英伟达

Etched Sohu AI 芯片问世在谈到 AI、大模型、算力等关键词时,如果要提及硬件产品,很多人应该会不假思索的说出英伟达。 一位华尔街分析师曾如此评论到: 人...
阅读原文

拯救Transformer推理能力!DeepMind新研究TransNAR:给模型嵌入「算法推理大脑」

新智元报道编辑:乔杨 好困 【新智元导读】DeepMind最近发表的一篇论文提出用混合架构的方法解决Transformer模型的推理缺陷。将Transformer的NLU技能与基于GN...
阅读原文

3D 版 SORA 来了!DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D

机器之心发布 机器之心编辑部2024 年 5 月,DreamTech 官宣了其高质量 3D 生成大模型 Direct3D,并公开了相关学术论文 Direct3D: Scalable Image-to-3D Gener...
阅读原文

AI研究的主要推动力会是什么?ChatGPT团队研究科学家:算力成本下降

机器之心报道 编辑:PandaAI 研究发展的主要推动力是什么?在最近的一次演讲中,OpenAI 研究科学家 Hyung Won Chung 给出了自己的答案。 近日,斯坦福大学《C...
阅读原文

万字长文!AI Agent架构概况:关于推理、规划和工具调用

‍‍直播预告 | 6月18日上午10点,「智猩猩AI新青年讲座」第240讲正式开讲,邀请到德州大学奥斯汀分校刘星超博士将直播讲解《利用直线概率流加速Stable Diffusi...
阅读原文

Latte一作马鑫:DiT架构在视频生成模型中的应用与扩展 | 讲座预告

「智猩猩AI新青年讲座」由智猩猩出品,致力于邀请青年学者,主讲他们在生成式AI、LLM、AI Agent、CV等人工智能领域的最新重要研究成果。 AI新青年是加速人工...
阅读原文

用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高

机器之心报道 编辑:Panda用神经架构搜索给 LLM 瘦身,同等准确度可让 LLaMA2-7B 模型大小降 2 倍。大型语言模型(LLM)的一个主要特点是「大」,也因此其训...
阅读原文

网络架构如何支持超万卡的大规模 AI 训练?

演讲嘉宾 | 席永青 AI 训练场景的算力 Scaling 核心是网络,依赖于大规模、高性能的数据中心网络集群来实现算力的规模扩展,为此,阿里云设计了 HPN7.0 架构...
阅读原文

作为人工智能下一个关口的意识研究:从加扎尼加的意识学说切入

来源:神经现实 摘要随着近年来人工智能(AI)的惊人进步,AI 是否具有意识以及如何构建有意识的 AI 系统越来 越受到学界和公众的关注。要回答这类问题,我们...
阅读原文

AI手机PC大爆发,Arm从软硬件到生态发力,打造行业AI百宝箱

生成式AI,Arm抛出AI软硬件加速全家桶。 作者|云鹏 编辑|漠影 随着“Gen-AI”时代的到来,AI手机、AI PC等关键核心移动设备都在快速与生成式AI结合,越来越多的...
阅读原文

英特尔牙膏挤爆:功耗降40%、AI算力120TOPS,你的下一代笔记本没有内存条了

西风 发自 凹非寺量子位 | 公众号 QbitAI英特尔为了AI,再次做出重大架构变革: 像手机一样搞起SoC(系统级芯片),你的下一台笔记本不会再有独立内存条。 刚...
阅读原文

AMD提前发布新AI芯片,硬刚英伟达!Zen 5架构性能提高一倍

夕小瑶科技说 原创作者 | 海野眼看着英伟达要打破摩尔定律,开启一年一更的新时代;搭载高通骁龙新芯片的设备,也将于数日后上市。AMD这坐不住啊:这风头怎么...
阅读原文

老黄自己卷自己!GPU要一年更新一代!预告新动作:AI工厂将吞噬一切

夕小瑶科技说 原创作者 | 小戏 站在 AI 时代风口浪尖的弄潮儿英伟达又为大家带来了一场科技饕餮盛宴! 昨晚 7 点,坐标中国台湾大学体育场,英伟达 CEO 黄仁...
阅读原文

单GPU训练一天,Transformer在100位数字加法上就达能到99%准确率

机器之心报道 机器之心编辑部乘法和排序也有效。 自 2017 年被提出以来,Transformer 已成为 AI 大模型的主流架构,一直稳站 C 位。 但所有研究者都不得不承...
阅读原文

骁龙 8 Gen4 发布时间确定,小米或再次首发

骁龙 8 Gen4 全面升级‍ 继高通去年十月发布骁龙 8 Gen3 后,已过去了三个季度。移动端的 9300 与 8 Gen3 之争,也随着本月最后一台 8 Gen3 超大杯发布而落下...
阅读原文
12345613