标签:性能
全新 iPad mini 体验:性能是最大亮点,还有一个「肉眼可见」更新
麻雀虽小 五脏俱全一台能打游戏,能画画,还能用 Apple 智能的 iPad,不一定是 iPad Pro,现在也可以是 iPad mini。 三年之期已到,iPad mini 终于迎来更新。...
如何通过KV稀疏实现对vLLM的1.5倍加速
作者 | PPIO 算法专家张青青前 言近一年以来,自 H2O 起,关于 KV 稀疏的论文便百花齐放,而在实际应用中不得不面临的一个问题便是学术论文与实际应用之间的...
开源版OpenAI再出「神作」,小模型吊打Llama 3!Ministral系列问世,边缘AI开启
新智元报道编辑:桃子 【新智元导读】Mistral 7B诞生一周年之际,法国AI初创公司Mistral再次连发两个轻量级模型Ministral 3B和Ministral 8B,性能赶超Llama 3...
骁龙8至尊版登场:CPU牙膏挤爆,AI生成速度创纪录,奥特曼也来助阵
机器之心报道 编辑:小舟、佳琪开启终端侧生成式 AI 的全新时代。高通新一代旗舰移动平台来了。 在 2024 骁龙峰会上,高通宣布推出「骁龙 8 至尊版」移动平台...
高通骁龙 8 至尊版发布,主频超 4GHz,Benchmark 6 多核破 1 万
牙膏 挤爆高通的骁龙旗舰芯片这几年的命名几经变更,比如前几年突然出现的骁龙 888,主要图一个吉利,后面变成了骁龙 8 Gen1、Gen2、Gen3,到了今年骁龙移动...
英伟达开源最新大模型Nemotron 70B后,只有OpenAI o1一个对手了
机器之心报道 编辑:杜伟、陈陈英伟达不仅要做显卡领域的领先者,还要在大模型领域逐渐建立起自己的优势。今天,英伟达又开源了一个性能超级强大的模型 —— Ll...
国产大模型首次超过 GPT-4o!零一万物「闪电」只用 2000 张 GPU 追平马斯克 Grok
每百万 token 仅需 0.99 元,直逼行业最低价。该不该从零开始预训练一个千亿级大模型? 这个问题从 2023 年 ChatGPT 破圈之后就一直成为行业人士的 Top 讨论...
破天荒!英特尔AMD联盟了,拯救x86
克雷西 发自 凹非寺量子位 | 公众号 QbitAIAMD与Intel两家巨头,在x86上选择了联手合作! AMD CEO苏姿丰(Lisa Su)和Intel CEO格尔辛格(Patrick Gelsinger...
苹果发文质疑:大语言模型根本无法进行逻辑推理
大语言模型(LLM)是真的会数学推理?还是只是在“套路”解题? 近年来,大语言模型在各种任务中的表现引起广泛关注。一个核心问题逐渐浮现:这些模型是否真正...
AMD发布最强AI芯片,对标英伟达Blackwell,2025年上市
机器之心报道 编辑:泽南、陈陈未来的大模型,或许都是 A 卡来算的? 从 PC 端到服务器,AMD 一次发布就完成了对 AI 计算的全覆盖。 今天凌晨,AMD 首席执行...
苏姿丰2小时演讲!发布AMD最强AI芯片,旗舰CPU单颗10万,OpenAI微软都来站台
五大硬核新品,轰向AI计算! 作者|ZeR0 编辑|漠影 猛,实在是猛!就在今日,老牌芯片巨头AMD交出了一份令人印象深刻的AI答卷。 智东西美国旧金山10月10日现场...
NeurIPS 2024|SparseLLM:突破性全局剪枝技术,大语言模型稀疏化
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
天玑 9400 发布!旗舰芯皇今年表现如何?
天玑 9400 乘胜追击今天上午,联发科发布了新一代旗舰处理器天玑 9400,这颗芯片除了在性能、影像与通讯带来升级外,进一步推进了 AI 能力的进化。 作为新一...
告别CUDA无需Triton!Mirage零门槛生成PyTorch算子,人均GPU编程大师?
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
耗资1.3万,ASU团队揭秘o1推理王者!碾压所有LLM成本超高,关键还会PUA
新智元报道编辑:桃子 好困 【新智元导读】LLM不会规划,大推理模型o1可以吗?ASU团队最新研究发现,o1-preview推理规划能力是所有模型之最,但仍未触及天花...