标签:负载

月之暗面Kimi引擎是怎么炼成的?底层推理系统方案深度揭秘(二)

直播预告 | 7月5日晚7点,「智猩猩机器人新青年讲座」第10讲正式开讲,北京通研院研究员贾宝雄博士主讲,主题为《具身智能视角下的三维场景理解、生成与交互...
阅读原文

Kimi论文自曝推理架构,80%流量都靠它承担

克雷西 发自 凹非寺量子位 | 公众号 QbitAI月之暗面和清华KVCache.ai团队的最新论文,首次揭秘了Kimi背后的推理架构! 要知道Kimi是国产大模型的当红炸子鸡,...
阅读原文

月之暗面kimi底层推理系统方案揭秘

7月2日晚七点,「NVIDIA 机器人技术公开课」正式开讲,NVIDIA解决方案架构总监舒家明将以《NVIDIA Isaac 加速机器人3D视觉感知与机械臂轨迹规划》为主题进行...
阅读原文

英特尔放大招:新制程、能效核一起上,144核的至强6,性能成倍提升

机器之心发布 机器之心编辑部今日,英特尔推出英特尔® 至强® 6能效核处理器,每个 CPU 拥有多达 144 个内核,机架密度提高达3倍1,以高性能、高密度、高能效...
阅读原文

黄仁勋亲自给OpenAI送货,全球首台DGX H200开箱了

机器之心报道 作者:泽南、杜伟又是一张历史性大合照。今天,黄仁勋又来送 AI 芯片了,还是超强悍的那种。 OpenAI 联合创始人、总裁 Greg Brockman 发推,晒...
阅读原文

大模型推理成本排行榜来了:贾扬清公司效率领跑

机器之心报道 编辑:小舟、泽南风投烧完之后,哪些大模型创业公司会开始盈利? 「大模型的 API 是个亏本买卖吗?」随着大语言模型技术的逐渐实用化,越来越多...
阅读原文

为AI加速而生:英特尔的至强,现在能跑200亿参数大模型了

机器之心报道 编辑:泽南实用化 AI 算力又升上了一个新台阶。 在人工智能的应用领域,出现了一些让人始料未及的趋势:很多传统企业开始选择在 CPU 平台上落地...
阅读原文

又一文件存储技术落地中国市场!支持跨云数据复制和备份

作者 | 李冬梅 在当今快节奏的业务环境中,用户在使用数据时更加注重效率,他们希望最大程度地提高处理大量数据的速度,以更快地获得洞察并减少总体时间,从...
阅读原文

AWS和英伟达打造了一台16,384个超级芯片的超级计算机

点击上方蓝字关注我们“ 亚马逊网络服务(AWS)与Nvidia达成战略合作,提供基于Nvidia GPU的生成AI基础设施,包括Ceiba项目创建的AI超级计算机,Nvidia DGX Cl...
阅读原文

微软深夜放大招:GPT-4 、DALL·E 3、GPTs免费用,自研大模型专用AI芯片

机器之心报道机器之心编辑部今天凌晨,微软公司召开最新一场 Ignite 大会,CEO 萨提亚・纳德拉在大会上介绍了 100 多项产品和技术的发布与更新,涉及范围非常...
阅读原文

突发!奥特曼宣布暂停ChatGPT Plus新用户注册!

夕小瑶科技说 原创作者 | 王二狗大新闻!就在刚刚!OpenAI的CEO Sam Altman宣布暂停ChatGPT Plus 新用户注册!Sam Altman对此解释道:由于OpenAI开发日后Chat...
阅读原文

英伟达推出史上最强AI芯片H200!141GB超大显存,Llama2推理性能翻倍

大数据文摘授权转载自夕小瑶科技说作者:王二狗英伟达又一次打了所有人措手不及!就在昨晚,老黄发布了新一代史上最强 AI芯片 NVIDIA HGX™ H200 。141 GB 超...
阅读原文

史上最强AI芯片!英伟达H200震撼来袭!141 GB 超大显存,Llama2推理性能翻倍,老黄赢麻了!

夕小瑶科技说 原创作者 | 王二狗英伟达又一次打了所有人措手不及!就在昨晚,老黄发布了新一代史上最强 AI芯片 NVIDIA HGX™ H200 。141 GB 超大显存!带宽增...
阅读原文

树莓派5来了:算力提升2.5倍,支持PCIe,438元起售

机器之心报道编辑:泽南、大盘鸡新平台,自研芯片,官方版操作系统也有了。树莓派 5 来了!昨天,开发者社区里突然传来了好消息。本次发布距离上代产品树莓派...
阅读原文

树莓派5来了!438元起售,CPU性能提高2-3倍

金磊 发自 凹非寺量子位 | 公众号 QbitAI千呼万唤始出来,时隔四年之久,树莓派5(Raspberry Pi 5)终于问世了!用官方的话术来介绍,就是“硬件方面全面升级”...
阅读原文