标签:节点

【深度万文】10 万卡 H100 集群的尽头……

7月25日上午10点,中国科学技术大学与微软亚洲研究院联合培养博士生张博文将在智猩猩直播讲解微软亚洲研究院开源成果GaussianCube,主题为《结构化3DGS为高质...
阅读原文

夏天太热怎么办?AI 为“降温”材料发现提速数千倍,你的手机、电脑或许再也不发烫了

大数据文摘受权转载自学术头条 炎炎夏日,智能手机、平板电脑等电子设备常因“过热”而产生性能、安全问题。如何设计出散热更好的电子产品,材料是关键。 而其...
阅读原文

KDD 2024|港大黄超团队深度解析大模型在图机器学习领域的「未知边界」

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

首个WebAgent在线评测框架和流程数据管理平台来了,GPT-4、Qwen登顶闭源和开源榜首!

夕小瑶科技说 原创作者 | 潘奕琛、孔德涵、周思达、崔成 在当今科技迅速发展的时代,大型语言模型(Large Language Model,LLM)正以前所未有的速度改变着我...
阅读原文

无损加速最高5x,EAGLE-2让RTX 3060的生成速度超过A100

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

6700万参数比肩万亿巨兽GPT-4!微软MIT等联手破解Transformer推理密码

新智元报道编辑:桃子 乔杨 【新智元导读】来自微软、MIT等机构的学者提出了一种创新的训练范式,攻破了大模型的推理缺陷。他们通过因果模型构建数据集,直接...
阅读原文

五年后的今天,训练GPT-2只需不到700刀、24小时,Karpathy又整新活

机器之心报道 编辑:杜伟、泽南论老黄卖铲子的技术含量。2019 年 2 月,OpenAI 发布了 GPT-2,因为在文本生成上的优异表现,以及对于预训练 Transformer 架构...
阅读原文

阿里发布大模型发布图结构长文本处理智能体,超越GPT-4-128k

夕小瑶科技说 原创作者 | Richard 随着大语言模型的发展,处理长文本的能力成为了一个重要挑战。虽然有许多方法试图解决这个问题,但都存在不同程度的局限性...
阅读原文

北航、滴滴联合提出一种新的增量度量框架,实现动态图结构熵的高效增量计算

作者 | 彭浩 本文介绍来自北京航空航天大学彭浩老师团队发表在 The journal of Artificial Intelligence 2024 上的一篇文章“Incremental Measurement of Stru...
阅读原文

月之暗面Kimi引擎是怎么炼成的?底层推理系统方案深度揭秘(二)

直播预告 | 7月5日晚7点,「智猩猩机器人新青年讲座」第10讲正式开讲,北京通研院研究员贾宝雄博士主讲,主题为《具身智能视角下的三维场景理解、生成与交互...
阅读原文

Kimi论文自曝推理架构,80%流量都靠它承担

克雷西 发自 凹非寺量子位 | 公众号 QbitAI月之暗面和清华KVCache.ai团队的最新论文,首次揭秘了Kimi背后的推理架构! 要知道Kimi是国产大模型的当红炸子鸡,...
阅读原文

月之暗面kimi底层推理系统方案揭秘

7月2日晚七点,「NVIDIA 机器人技术公开课」正式开讲,NVIDIA解决方案架构总监舒家明将以《NVIDIA Isaac 加速机器人3D视觉感知与机械臂轨迹规划》为主题进行...
阅读原文

双臂机器人高效规划器DAG-Plan:利用大语言模型生成子任务的有向无环图

6月27日15点,3位腾讯云专家将在线直播,分享腾讯云在内容创作、Al问答及知识点提炼、智能调研和报告生成等领域的应用探索和落地实践,欢迎扫码预约直播。导...
阅读原文

有钱买卡还不够,10万卡H100集群有多难搭?一文解析算力集群技术要点

新智元报道编辑:乔杨 好困 【新智元导读】在英伟达市值猛涨、各家科技巨头囤芯片的热潮中,我们往往会忽视GPU芯片是如何转变为数据中心算力的。最近,一篇Se...
阅读原文

8B模型奥数成绩比肩GPT-4!上海AI Lab出品

克雷西 发自 凹非寺量子位 | 公众号 QbitAI只要1/200的参数,就能让大模型拥有和GPT-4一样的数学能力? 来自复旦和上海AI实验室的研究团队,刚刚研发出了具有...
阅读原文