标签:架构
面向边缘端大语言模型的RPP架构芯片与落地实践 | 演讲预告
生成式AI时代,大模型及AIGC的快速发展推动着计算需求的高速增长。 从服务器到边缘,再到AI手机、AI PC、AIoT、智能汽车,各个领域的AI芯片玩家都面临着新的...
上交大新型SRAM存内计算架构「COMPASS」,开启类脑计算新时代
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
MiniMax 基于 Apache Doris 升级日志系统,PB 数据秒级查询响应技术实践
作者|MiniMax 基础架构研发工程师 Koyomi、香克斯、Tinker 导读:早期 MiniMax 基于 Grafana Loki 构建了日志系统,在资源消耗、写入性能及系统稳定性上都面...
Jamba 1.5发布,最长上下文,非Transformer架构首次成功领先
昨天,号称当前最强、最高效的长上下文模型——Jamba 1.5 系列发布。 Jamba 是第一个基于 Mamba 架构的生产级模型。Mamba 是由卡内基梅隆大学和普林斯顿大学的...
紫光同芯重磅发布两款芯片,未来将重点布局人工智能
8 月 21 日,在 2024 紫光同芯合作伙伴大会上,紫光同芯两款新品重磅发布:全球首颗开放式架构安全芯片——E450R、国内首颗通过 ASIL D 产品认证的高端旗舰级 R...
国内首个自研MoE多模态大模型,揭秘腾讯混元多模态理解
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
多亏Transformer,Mamba更强了!仅用1%计算量达新SOTA
明敏 发自 凹非寺量子位 | 公众号 QbitAIAttention is all you need. 至少在矩阵这儿是。 Mamba架构最新进展:仅需1%计算量,新模型性能达SOTA。 能做到这一...
爆火神经网络架构KAN更新2.0!研究者可专属定制,轻松应对经典物理学研究,作者:和MLP不能互相取代
白交 发自 凹非寺量子位 | 公众号 QbitAI爆火神经网络架构KAN,上新了! KAN2.0。 此次与科学问题更深入地融合,可以轻松解出经典物理学研究。 比如发现拉格...
机器人策略学习的Game Changer?伯克利提出Body Transformer
机器之心报道 编辑:Panda过去几年间,Transformer 架构已经取得了巨大的成功,同时其也衍生出了大量变体,比如擅长处理视觉任务的 Vision Transformer(ViT...
从GPU到TPU,AI大模型基础设施的变迁与未来 | 演讲预告
生成式AI时代,大模型及AIGC的快速发展推动着计算需求的高速增长。 从服务器到边缘,再到AI手机、AI PC、AIoT、智能汽车,各个领域的AI芯片玩家都面临着新的...
清华太极-Ⅱ 光芯片登上Nature,首创架构突破智能光计算训练难题
大数据文摘授权转载学术头条 撰文:马雪薇 未来的人工智能(AI)模型,或许可以用“光”来训练了。长期以来,传统的电子计算推动着 AI 模型规模的不断扩展,但...
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
新智元报道编辑:编辑部 【新智元导读】TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B,性能与Transformer架构模型相媲美,在多个基准测试上的均...
非Transformer架构站起来了!首个纯无注意力大模型,超越开源巨头Llama 3.1
机器之心报道 编辑:杜伟、陈陈Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来...
论文荣登计算机体系结构顶会ISCA,芯片架构成为边缘AI最佳并行计算选择
机器之心发布 机器之心编辑部AI 大模型的爆发带动了 GPU 的强劲需求,从云端到边缘渗透的 AI 应用也将带动边缘 AI 服务器及加速处理器的需求。通过对比 GPGPU...