标签:性能
全球首台Arm超算光荣退役!下一代已接任,配备384块英伟达Grace CPU
新智元报道编辑:桃子 【新智元导读】世界上首个基于Arm架构的超算,完成6年使命之后,终于要退役了。这台被部署在英国最强超算Isambard 2,帮助世界推动了模...
单靠推理Scaling Law无法成就o1!无限推理token,GPT-4o依然完败
新智元报道编辑:编辑部 HXY 【新智元导读】o1的秘诀,和全新的「推理Scaling Law」关系有多大?Epoch AI最近的对比实验表明,算法创新才是关键。CoT铸就了o1...
最高配 128 核!英特尔至强 6 性能核处理器发布:运行 Llama2-7B 快了 3.08 倍
作者 | 褚杏娟 “英特尔至强 6 性能核,将是英特尔有史以来性能最强大的至强处理器。”英特尔数据中心与人工智能集团副总裁、中国区总经理陈葆立在 9 月 6 日...
利用公开知识定向提升大模型,腾讯优图&上交大提出新方法,性能达SOTA
优图实验室 投稿量子位 | 公众号 QbitAI告别传统指令微调,大模型特定任务性能提升有新方法了。 一种新型开源增强知识框架,可以从公开数据中自动提取相关知...
英特尔最强服务器CPU来了!AI性能直接翻倍
梦晨 金磊 发自 凹非寺量子位 | 公众号 QbitAI服务器CPU领域持续多年的核心数量大战,被一举终结了! 英特尔最新发布的至强®6 性能核处理器(P-core系列),...
英伟达RTX 5090功耗高达600W,32G显存,核心比5080多一倍
机器之心报道 编辑:泽南、小舟RTX 50 系列的发布日期可能会在明年初。英伟达的 RTX 50 系列会整出什么新活? 随着芯片发布日期的临近,人们的猜测也越来越密...
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
新智元报道编辑:LRS 【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了L...
CoT神话破灭,并非LLM标配!三大学府机构联手证实,CoT仅在数学符号推理有用
新智元报道编辑:桃子 【新智元导读】CoT只对数学、符号推理才起作用,其他的任务几乎没什么卵用!这是来自UT-Austin、霍普金斯、普林斯顿三大机构研究人员联...
o1带火的CoT到底行不行?新论文引发了论战
机器之心报道 编辑:PandaTo CoT or not to CoT? OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成...
从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了
机器之心报道 编辑:陈陈、杜伟大语言模型(LLM)的发展同时往往伴随着硬件加速技术的进化,本文对使用 FPGA、ASIC 等芯片的模型性能、能效表现来了一次全面...
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
新智元报道编辑:LRS 【新智元导读】MMMU-Pro通过三步构建过程(筛选问题、增加候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新...
国产最大MoE开源模型发布!腾讯AI Lab创始人带队,已融2亿美元
2550亿参数、免费可商用,前腾讯副总裁创业。 编辑|香草 智东西9月13日报道,今日,大模型创企元象XVERSE发布国内最大MoE开源模型XVERSE-MoE-A36B,其总参数2...
边缘智能的新时代:端侧大模型的研究进展综述
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
TensorRT-LLM保姆级教程(一)-快速入门
随着大模型的爆火,投入到生产环境的模型参数量规模也变得越来越大(从数十亿参数到千亿参数规模),从而导致大模型的推理成本急剧增加。因此,市面上也出现...
索尼发布 PS5 Pro,价格比性能飞更高
PS5 Pro 价格比性能 飞更高昨晚,PlayStation 官方在 YouTube 频道的直播中放出了 PS5 Pro 的技术演示。 这是 PS5 从 2020 年发布以来,首次进行性能升级,PS...