标签:架构

一年砸 10 亿只是开始,被“神话”的端到端,在中国自动驾驶圈的“最佳实践”能挣钱吗?

作者 | 华卫 预计再过不到半年,特斯拉 FSD 就将正式入华了。9 月 5 日,特斯拉宣布,FSD 将于 2025 年第一季度在中国和欧洲推出。 而前不久,基于端到端的...
阅读原文

AMD放弃旗舰游戏显卡,专注AI,新统一架构挑战英伟达CUDA生态

梦晨 发自 凹非寺量子位 | 公众号 QbitAI短短几天内,AMD连续宣布两项颠覆性的转变: 放弃旗舰游戏显卡,转而抢占中低端市场份额 专注AI,统一现在并存的两种...
阅读原文

2024全球AI芯片峰会收官:架构创新群雄混战,边端较劲大模型,两大榜单公布

一文速览2024全球AI芯片峰会第二天精华! 芯东西9月7日报道,9月6日~7日,2024全球AI芯片峰会(GACS 2024)在北京举行。本届峰会以「智算纪元 共筑芯路」为主...
阅读原文

用60%成本干80%的事,DeepSeek分享沉淀多年的高性能深度学习架构

机器之心报道 编辑:Panda硬件发展速度跟不上 AI 需求,就需要精妙的架构和算法。根据摩尔定律,计算机的速度平均每两年就会翻一倍,但深度学习的发展速度还...
阅读原文

英特尔发布新一代 AIPC 芯片!史上最高效的 x86,号称全面压过高通旗舰

与黄仁勋让你们相信的不同,摩尔定律依然活着,而且还活得很好。 在今年的台北电脑展上,英特尔 CEO 帕特·基辛格,直接回怼了黄仁勋「传统处理器在 AI 时代正...
阅读原文

微软Win11中发现国产开源大模型!RWKV官方:没人给我钱啊?现在捐赠还来得及

西风 发自 凹非寺量子位 | 公众号 QbitAI微软正尝试在Office中集成国产开源大模型RWKV! RWKV官方甚至直接发了个推文表示: RWKV.cpp,现已在全球五亿系统中...
阅读原文

大模型应用新战场:揭秘终端侧AI竞争关键|智在终端

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI2024年过去2/3,大模型领域的一个共识开始愈加清晰: AI技术的真正价值在于其普惠性。没有应用,基础模型将无法发挥...
阅读原文

面向边缘端大语言模型的RPP架构芯片与落地实践 | 演讲预告

生成式AI时代,大模型及AIGC的快速发展推动着计算需求的高速增长。 从服务器到边缘,再到AI手机、AI PC、AIoT、智能汽车,各个领域的AI芯片玩家都面临着新的...
阅读原文

上交大新型SRAM存内计算架构「COMPASS」,开启类脑计算新时代

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

MiniMax 基于 Apache Doris 升级日志系统,PB 数据秒级查询响应技术实践

作者|MiniMax 基础架构研发工程师 Koyomi、香克斯、Tinker 导读:早期 MiniMax 基于 Grafana Loki 构建了日志系统,在资源消耗、写入性能及系统稳定性上都面...
阅读原文

Jamba 1.5发布,最长上下文,非Transformer架构首次成功领先

昨天,号称当前最强、最高效的长上下文模型——Jamba 1.5 系列发布。 Jamba 是第一个基于 Mamba 架构的生产级模型。Mamba 是由卡内基梅隆大学和普林斯顿大学的...
阅读原文

紫光同芯重磅发布两款芯片,未来将重点布局人工智能

8 月 21 日,在 2024 紫光同芯合作伙伴大会上,紫光同芯两款新品重磅发布:全球首颗开放式架构安全芯片——E450R、国内首颗通过 ASIL D 产品认证的高端旗舰级 R...
阅读原文

国内首个自研MoE多模态大模型,揭秘腾讯混元多模态理解

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

多亏Transformer,Mamba更强了!仅用1%计算量达新SOTA

明敏 发自 凹非寺量子位 | 公众号 QbitAIAttention is all you need. 至少在矩阵这儿是。 Mamba架构最新进展:仅需1%计算量,新模型性能达SOTA。 能做到这一...
阅读原文

爆火神经网络架构KAN更新2.0!研究者可专属定制,轻松应对经典物理学研究,作者:和MLP不能互相取代

白交 发自 凹非寺量子位 | 公众号 QbitAI爆火神经网络架构KAN,上新了! KAN2.0。 此次与科学问题更深入地融合,可以轻松解出经典物理学研究。 比如发现拉格...
阅读原文
12313