标签:架构

机器人策略学习的Game Changer?伯克利提出Body Transformer

机器之心报道 编辑:Panda过去几年间,Transformer 架构已经取得了巨大的成功,同时其也衍生出了大量变体,比如擅长处理视觉任务的 Vision Transformer(ViT...
阅读原文

计算机科学最重要的3个问题

来源:图灵人工智能 计算机科学探索信息处理和系统设计 计算机科学是研究信息和信息处理过程,以及它们与计算机系统的设计、实现和应用的科学。它不仅仅关注...
阅读原文

从GPU到TPU,AI大模型基础设施的变迁与未来 | 演讲预告

生成式AI时代,大模型及AIGC的快速发展推动着计算需求的高速增长。 从服务器到边缘,再到AI手机、AI PC、AIoT、智能汽车,各个领域的AI芯片玩家都面临着新的...
阅读原文

清华太极-Ⅱ 光芯片登上Nature,首创架构突破智能光计算训练难题

大数据文摘授权转载学术头条 撰文:马雪薇 未来的人工智能(AI)模型,或许可以用“光”来训练了。长期以来,传统的电子计算推动着 AI 模型规模的不断扩展,但...
阅读原文

Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人

新智元报道编辑:编辑部 【新智元导读】TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B,性能与Transformer架构模型相媲美,在多个基准测试上的均...
阅读原文

非Transformer架构站起来了!首个纯无注意力大模型,超越开源巨头Llama 3.1

机器之心报道 编辑:杜伟、陈陈Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来...
阅读原文

论文荣登计算机体系结构顶会ISCA,芯片架构成为边缘AI最佳并行计算选择

机器之心发布 机器之心编辑部AI 大模型的爆发带动了 GPU 的强劲需求,从云端到边缘渗透的 AI 应用也将带动边缘 AI 服务器及加速处理器的需求。通过对比 GPGPU...
阅读原文

黑匣子被打开了!能玩的Transformer可视化解释工具,本地运行GPT-2、还可实时推理

机器之心报道 编辑:杜伟、大盘鸡都 2024 年,还有人不了解 Transformer 工作原理吗?快来试一试这个交互式工具吧。2017 年,谷歌在论文《Attention is all y...
阅读原文

2.5天完成1年的MD计算?DeepMind团队基于欧几里得Transformer的新计算方法

将 ScienceAI设为星标 第一时间掌握 新鲜的 AI for Science 资讯编辑 | 萝卜皮 近年来,基于从头算参考计算的机器学习力场 (MLFF) 的开发取得了巨大进展。虽...
阅读原文

10.98 万元的吉利银河 E5,就是一辆「小极氪」

在刚刚过去的周末里,吉利搞了个大新闻:吉利银河 E5 上市,10.98 万元起。 要注意的是,这是算上了限时优惠的价格,只有在 10 月 1 日前下定的用户,才能获...
阅读原文

锋行致远孙唐:存算大模型加速系统

生成式AI时代,大模型及AIGC的快速发展推动着计算需求的高速增长。 从服务器到边缘,再到AI手机、AI PC、AIoT、智能汽车,各个领域的AI芯片玩家都面临着新的...
阅读原文

阿里「轨迹可控版Sora」,告别「抽卡」,让视频生成更符合物理规律

机器之心报道 编辑:陈陈、杜伟你规定路线,Tora 来生成相应轨迹的视频。目前,扩散模型能够生成多样化且高质量的图像或视频。此前,视频扩散模型采用 U-Net ...
阅读原文

DeepMind研究成本大起底,一篇ICML论文烧掉1290万美元

新智元报道编辑:乔杨 【新智元导读】DeepMind最近被ICML 2024接收的一篇论文,完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和...
阅读原文

合合信息研发总监常扬:大模型RAG技术架构与应用实践 | 公开课预告

随着大语言模型的兴起,其在处理自然语言任务上展现出了强大的能力,但也逐渐暴露出一些问题。大语言模型虽然能够生成连贯且富有逻辑的文本,但在某些情况下...
阅读原文

英伟达,又在领跑?

大数据文摘受权转载自头部科技 文丨俊俊 英伟达(Nvidia)的一举一动,都吸引着大家的目光。 近日, SIGGRAPH 2024 上,英伟达公布了一系列软件更新,主要涉...
阅读原文
123413