标签:节点

用60%成本干80%的事,DeepSeek分享沉淀多年的高性能深度学习架构

机器之心报道 编辑:Panda硬件发展速度跟不上 AI 需求,就需要精妙的架构和算法。根据摩尔定律,计算机的速度平均每两年就会翻一倍,但深度学习的发展速度还...
阅读原文

OpenAI首颗芯片曝光:台积电1.6nm,为Sora定制

夕小瑶科技说 分享来源 | 量子位OpenAI首颗芯片的消息终于曝光—— 将采用台积电最先进的A16埃米级工艺,专为Sora视频应用打造。 埃米是比纳米还小一级的单位,...
阅读原文

LLM 推理框架之上:10 种常见 LLM 推理系统总结

9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京辽宁大厦盛大举行。峰会设有开幕式、数据中心AI芯片专场、AI芯片架构创新专场、边缘/端侧AI芯片专场、...
阅读原文

LLM蒸馏到GNN,性能提升6.2%!Emory提出大模型蒸馏到文本图|CIKM 2024

新智元报道编辑:LRST 【新智元导读】Emory大学的研究团队提出了一种创新的方法,将大语言模型(LLM)在文本图(Text-Attributed Graph, 缩写为TAG)学习中的...
阅读原文

Emory提出最新PolygonGNN框架:可捕捉通用多边形内外的空间关系 | KDD 2024

新智元报道编辑:LRST 【新智元导读】PolygonGNN是一种新型框架,用于学习包括单一和多重多边形在内的多边形几何体的表征,它通过异质可见图来捕捉多边形内外...
阅读原文

上海交大周冰心博士:锚定稀缺生物数据挑战,图神经网络重塑蛋白质理解与生成

作者:周冰心 编辑:十九 在上海交通大学 AI for Bioengineering 暑期学校中,上海交通大学周冰心博士以「图神经网络与蛋白质结构表征」为题,向大家分享了图...
阅读原文

机器人策略学习的Game Changer?伯克利提出Body Transformer

机器之心报道 编辑:Panda过去几年间,Transformer 架构已经取得了巨大的成功,同时其也衍生出了大量变体,比如擅长处理视觉任务的 Vision Transformer(ViT...
阅读原文

两个小模型互相验证,直接比肩大模型?微软的rStar甚至没用CoT和微调

机器之心报道 编辑:Panda互相检查,让小模型也能解决大问题。 众所周知,LLM 很强大,但执行复杂推理的能力还不够强。 举个例子,在 GSM8K 数据集上,Mistra...
阅读原文

OpenAI爆料者竟然是智能体?斯坦福系创企推出新一代智能体AgentQ

最近,OpenAI 的秘密项目「Q*」一直受到了圈内人士的广泛关注。上个月,以它为前身、代号为「草莓(Strawberry)」的项目又被曝光了。据推测,该项目能够提供...
阅读原文

一直爆料OpenAI「草莓」的账号,竟然是个智能体?斯坦福系创企「炒作」AgentQ

机器之心报道 编辑:杜伟、佳琪当炒作出了「泼天的流量」,已经没人关心产品厉不厉害了。最近,OpenAI 的秘密项目「Q*」一直受到了圈内人士的广泛关注。上个...
阅读原文

对吴恩达 workflow 概念产品化的思考

大模型时代最火AI芯片峰会来啦!!9月6-7日,由芯东西联合主办的2024全球AI芯片峰会将在北京举行。峰会设有数据中心AI芯片、智算集群等7大板块。目前,AMD人...
阅读原文

还没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?

机器之心报道 编辑:佳琪、泽南来自上海人工智能实验室。 有 AI 在的科技圈,似乎没有中场休息。除了大模型发布不断,各家科技大厂也在寻找着第一个「杀手级...
阅读原文

【深度万文】10 万卡 H100 集群的尽头……

7月25日上午10点,中国科学技术大学与微软亚洲研究院联合培养博士生张博文将在智猩猩直播讲解微软亚洲研究院开源成果GaussianCube,主题为《结构化3DGS为高质...
阅读原文

夏天太热怎么办?AI 为“降温”材料发现提速数千倍,你的手机、电脑或许再也不发烫了

大数据文摘受权转载自学术头条 炎炎夏日,智能手机、平板电脑等电子设备常因“过热”而产生性能、安全问题。如何设计出散热更好的电子产品,材料是关键。 而其...
阅读原文

KDD 2024|港大黄超团队深度解析大模型在图机器学习领域的「未知边界」

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文
1235