标签:架构

MIT系初创打破Transformer霸权!液体基础模型刷新SOTA,非GPT架构首次显著超越Transformer

新智元报道编辑:Aeneas 好困 【新智元导读】就在刚刚,MIT系初创公司Liquid AI推出液体基础模型LFM,1B模型在基准测试中成为SOTA,这是非GPT架构首次显著超...
阅读原文

DeepSeek 万卡集群及软硬件协同设计框架Fire-Flyer AI-HPC

GTIC 2024中国AI PC创新峰会将于10月11日,在2024上海国际消费电子展TechG同期举办。联想集团首席研究员颜毅强、荣耀终端有限公司PC产品研发系统部部长席迎军...
阅读原文

英伟达5090被曝32G大显存、核心是5080的两倍!网友:怕不是B200双芯封装技术下放

克雷西 发自 凹非寺量子位 | 公众号 QbitAI32GB GDDR7内存,CUDA核心数21760个—— 关于英伟达下一代旗舰消费级显卡5090,知名消息人士kopite7kimi给出了最新爆...
阅读原文

广东首个国产TPU智算中心怎么建起来的?

作者 | 褚杏娟 9 月 9 日,广东地区首个采用国产 TPU 技术的智算中心成立。该项目一期由 32 个算力节点通过高效互联构建而成,后期将扩容至千卡规模,形成训...
阅读原文

「群体智能」剑指AGI革命!国产架构挑战Transformer霸权,首款非Attention模型更新

新智元报道编辑:编辑部 【新智元导读】通往AGI的路径只有一条吗?实则不然。这家国产AI黑马认为,「群体智能」或许是一种最佳的尝试。他们正打破惯性思维,...
阅读原文

与其造神,不如依靠群体的力量:这家公司走出了一条不同于OpenAI的AGI路线

机器之心原创 作者:张倩看过剧版《三体》的读者或许都记得一个名场面:来自三体的智子封锁了人类科技,还向地球人发出了「你们是虫子」的宣告。但没有超能力...
阅读原文

三个大模型组队挑战o1,实测360多模型协作干掉提示词工程

克雷西 发自 凹非寺量子位 | 公众号 QbitAIOpenAI o1的横空出世,开启了大模型演化的新范式——Inference law(推理定律)。 正如英伟达AI科学家Jim Fan所说,o...
阅读原文

从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了

机器之心报道 编辑:陈陈、杜伟大语言模型(LLM)的发展同时往往伴随着硬件加速技术的进化,本文对使用 FPGA、ASIC 等芯片的模型性能、能效表现来了一次全面...
阅读原文

一年砸 10 亿只是开始,被“神话”的端到端,在中国自动驾驶圈的“最佳实践”能挣钱吗?

作者 | 华卫 预计再过不到半年,特斯拉 FSD 就将正式入华了。9 月 5 日,特斯拉宣布,FSD 将于 2025 年第一季度在中国和欧洲推出。 而前不久,基于端到端的...
阅读原文

AMD放弃旗舰游戏显卡,专注AI,新统一架构挑战英伟达CUDA生态

梦晨 发自 凹非寺量子位 | 公众号 QbitAI短短几天内,AMD连续宣布两项颠覆性的转变: 放弃旗舰游戏显卡,转而抢占中低端市场份额 专注AI,统一现在并存的两种...
阅读原文

2024全球AI芯片峰会收官:架构创新群雄混战,边端较劲大模型,两大榜单公布

一文速览2024全球AI芯片峰会第二天精华! 芯东西9月7日报道,9月6日~7日,2024全球AI芯片峰会(GACS 2024)在北京举行。本届峰会以「智算纪元 共筑芯路」为主...
阅读原文

用60%成本干80%的事,DeepSeek分享沉淀多年的高性能深度学习架构

机器之心报道 编辑:Panda硬件发展速度跟不上 AI 需求,就需要精妙的架构和算法。根据摩尔定律,计算机的速度平均每两年就会翻一倍,但深度学习的发展速度还...
阅读原文

英特尔发布新一代 AIPC 芯片!史上最高效的 x86,号称全面压过高通旗舰

与黄仁勋让你们相信的不同,摩尔定律依然活着,而且还活得很好。 在今年的台北电脑展上,英特尔 CEO 帕特·基辛格,直接回怼了黄仁勋「传统处理器在 AI 时代正...
阅读原文

微软Win11中发现国产开源大模型!RWKV官方:没人给我钱啊?现在捐赠还来得及

西风 发自 凹非寺量子位 | 公众号 QbitAI微软正尝试在Office中集成国产开源大模型RWKV! RWKV官方甚至直接发了个推文表示: RWKV.cpp,现已在全球五亿系统中...
阅读原文

大模型应用新战场:揭秘终端侧AI竞争关键|智在终端

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI2024年过去2/3,大模型领域的一个共识开始愈加清晰: AI技术的真正价值在于其普惠性。没有应用,基础模型将无法发挥...
阅读原文
123414