标签:性能
阿里云AMD护航,天谋科技携IoTDB登顶TPCx-IoT国际权威榜单
阿里云AMD助力,天谋科技基于IoTDB的企业级时序数据库登上TPCx-IoT榜单榜首! 作者|三北 编辑|漠影 智东西9月11日报道,近日,专业时序数据管理服务商天谋科...
Apple Intelligence深夜炸场!苹果发布4颗自研芯片,iPhone/iWatch/AirPods大升级
作者:十九,李宝珠 编辑:十九 9 月 10 日凌晨 1 点,在一年一度的苹果秋季发布会上,苹果推出的新产品 iPhone 16、AirPods、Apple Watch Series 10 基于强...
面壁小钢炮 3.0 重磅发布!“无限”长文本,性能超 Kimi
整理 | 褚杏娟 近日,面壁智能宣布,旗舰端侧模型面壁「小刚炮」系列进化为全新 MiniCPM 3.0 基座模型,再次以小博大,以 4B 参数,带来超越 GPT-3.5 的性能...
英伟达下一代GPU泄露!RTX 5080比4090提升10%,5090功耗高达600W
新智元报道编辑:好困 【新智元导读】根据最新泄露的数据,英伟达GeForce RTX 5080的功耗或将提升至400W,并在部分性能上达到RTX 4090的110%!而RTX 5090的功...
国产新能源,难道就不能卖贵点儿?
破除 枷锁最近刷小红书,陆续刷到好多个帖子对「阿维塔 012」卖 70 万表示很不理解。 上一次大家表示不太理解的车还是极氪 009 光辉版,这款车 78.9 万元起...
AI领域的新王者:Reflection 70B如何颠覆开源AI模型的格局
点击上方蓝字关注我们“反思 70B是HyperWrite推出的最新开源大语言模型,通过自主纠错技术和卓越性能,在多个基准测试中击败顶级商用模型,标志着开源AI进入新...
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
新智元报道编辑:乔杨 Frey 【新智元导读】用英伟达的GPU,但可以不用CUDA?PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA...
4B小模型掀翻大模型牌桌!性能超GPT-3.5,无限长文本性能超Kimi…
杀疯了!杀疯了! 你敢相信 4B 参数小模型,性能却超越千亿量级的 GPT-3.5 ! OpenAI、谷歌、微软、苹果等一众海内外巨头还没做到的事,被一家中国大模型公司...
端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前
下周苹果即将召开发布会了! 但最令笔者期待的不是 iphone16,而是苹果今年提出的 Apple Intelligence 的进展,这是苹果今年进军端侧 AI 的一大杀手锏。 其实...
AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的
机器之心报道 编辑:Panda都很贵。AMD vs 英伟达绝对算是一个长盛不衰的话题 —— 从玩游戏用哪家强到如今训练 AI 哪个更高效?原因也很简单:它们的 GPU 产品...
英特尔发布新一代 AIPC 芯片!史上最高效的 x86,号称全面压过高通旗舰
与黄仁勋让你们相信的不同,摩尔定律依然活着,而且还活得很好。 在今年的台北电脑展上,英特尔 CEO 帕特·基辛格,直接回怼了黄仁勋「传统处理器在 AI 时代正...
Rust 引领前端基建新潮流:字节跳动的深度应用实践 | QCon
演讲嘉宾 | 张磊 字节跳动 /Web Infra 前端负责人 整理|Penny 编辑|Kitty 近年来,XR 技术兴起以及人工智能技术的高速发展,为大前端领域注入了新的活力。...
AI 推理竞赛正在升温
作者丨 Dina Genkina 译者丨明知山 策划丨褚杏娟 虽然英伟达的 GPU 在 AI 训练领域的主导地位仍然难以撼动,但似乎有迹象表明,在 AI 推理方面,竞争对手正在...
Mamba作者新作:将Llama3蒸馏成混合线性 RNN
机器之心报道 机器之心编辑部Transformer 在深度学习领域取得巨大成功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分,...
大模型训练及推理经典必读:FP8的what,why,how及其带来的机会?
生成式AI时代最火AI芯片峰会下月来袭!9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京盛大举行。峰会设有开幕式、数据中心AI芯片专场、边缘/端侧AI芯...