标签:节点

首个WebAgent在线评测框架和流程数据管理平台来了,GPT-4、Qwen登顶闭源和开源榜首!

夕小瑶科技说 原创作者 | 潘奕琛、孔德涵、周思达、崔成 在当今科技迅速发展的时代,大型语言模型(Large Language Model,LLM)正以前所未有的速度改变着我...
阅读原文

无损加速最高5x,EAGLE-2让RTX 3060的生成速度超过A100

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

6700万参数比肩万亿巨兽GPT-4!微软MIT等联手破解Transformer推理密码

新智元报道编辑:桃子 乔杨 【新智元导读】来自微软、MIT等机构的学者提出了一种创新的训练范式,攻破了大模型的推理缺陷。他们通过因果模型构建数据集,直接...
阅读原文

五年后的今天,训练GPT-2只需不到700刀、24小时,Karpathy又整新活

机器之心报道 编辑:杜伟、泽南论老黄卖铲子的技术含量。2019 年 2 月,OpenAI 发布了 GPT-2,因为在文本生成上的优异表现,以及对于预训练 Transformer 架构...
阅读原文

阿里发布大模型发布图结构长文本处理智能体,超越GPT-4-128k

夕小瑶科技说 原创作者 | Richard 随着大语言模型的发展,处理长文本的能力成为了一个重要挑战。虽然有许多方法试图解决这个问题,但都存在不同程度的局限性...
阅读原文

北航、滴滴联合提出一种新的增量度量框架,实现动态图结构熵的高效增量计算

作者 | 彭浩 本文介绍来自北京航空航天大学彭浩老师团队发表在 The journal of Artificial Intelligence 2024 上的一篇文章“Incremental Measurement of Stru...
阅读原文

月之暗面Kimi引擎是怎么炼成的?底层推理系统方案深度揭秘(二)

直播预告 | 7月5日晚7点,「智猩猩机器人新青年讲座」第10讲正式开讲,北京通研院研究员贾宝雄博士主讲,主题为《具身智能视角下的三维场景理解、生成与交互...
阅读原文

Kimi论文自曝推理架构,80%流量都靠它承担

克雷西 发自 凹非寺量子位 | 公众号 QbitAI月之暗面和清华KVCache.ai团队的最新论文,首次揭秘了Kimi背后的推理架构! 要知道Kimi是国产大模型的当红炸子鸡,...
阅读原文

月之暗面kimi底层推理系统方案揭秘

7月2日晚七点,「NVIDIA 机器人技术公开课」正式开讲,NVIDIA解决方案架构总监舒家明将以《NVIDIA Isaac 加速机器人3D视觉感知与机械臂轨迹规划》为主题进行...
阅读原文

双臂机器人高效规划器DAG-Plan:利用大语言模型生成子任务的有向无环图

6月27日15点,3位腾讯云专家将在线直播,分享腾讯云在内容创作、Al问答及知识点提炼、智能调研和报告生成等领域的应用探索和落地实践,欢迎扫码预约直播。导...
阅读原文

有钱买卡还不够,10万卡H100集群有多难搭?一文解析算力集群技术要点

新智元报道编辑:乔杨 好困 【新智元导读】在英伟达市值猛涨、各家科技巨头囤芯片的热潮中,我们往往会忽视GPU芯片是如何转变为数据中心算力的。最近,一篇Se...
阅读原文

8B模型奥数成绩比肩GPT-4!上海AI Lab出品

克雷西 发自 凹非寺量子位 | 公众号 QbitAI只要1/200的参数,就能让大模型拥有和GPT-4一样的数学能力? 来自复旦和上海AI实验室的研究团队,刚刚研发出了具有...
阅读原文

大模型+蒙特卡洛树搜索,一招让LLaMa-3 8B奥数水平直逼GPT-4

机器之心报道 编辑:陈萍、杜伟通过算法层面的创新,未来大语言模型做数学题的水平会不断地提高。这几天,17 岁中专生姜萍在 2024 阿里巴巴全球数学竞赛预选...
阅读原文

有望解决一个千禧年大奖难题,这个20多年前的猜想终于得到证明

选自quantamagazine 作者:Leila Sloman 机器之心编译 编辑:Panda在数学抽象方面,最简单的莫过于图(graph)了。在平面上散放一些点,用线将其中一些连接起...
阅读原文

「AI+物理先验知识」,浙大、中国科学院通用蛋白质-配体相互作用评分方法登Nature子刊

将 ScienceAI设为星标 第一时间掌握 新鲜的 AI for Science 资讯编辑 | X 蛋白质就像是身体中的精密锁具,而药物分子则是钥匙,只有完美契合的钥匙才能解锁治...
阅读原文