标签:速度
Mamba一作再祭神作,H100利用率飙至75%!FlashAttention三代性能翻倍,比标准注意力快16倍
新智元报道编辑:编辑部 【新智元导读】时隔一年,FlashAttention又推出了第三代更新,专门针对H100 GPU的新特性进行优化,在之前的基础上又实现了1.5~2倍的...
英伟达又赚到了!FlashAttention3来了:H100利用率飙升至75%
机器之心报道 编辑:陈陈、小舟740 TFLOPS!迄今最强 FlashAttention 来了。随着大型语言模型(LLM)加速落地,扩展模型上下文窗口变得越来越重要。然而,Tra...
Groq发布超快LLM引擎,速度让英伟达望尘莫及
点击上方蓝字关注我们“Groq公司最新推出的LLM引擎在速度和智能化方面取得突破,其响应速度达到每秒1256.54个token,远超Nvidia GPU,为AI应用部署提供了新的...
OpenAI停服,国产大模型免费用!开发者Token实现了
机器之心发布 机器之心编辑部今天凌晨,OpenAI 突然宣布终止对中国提供 API 服务,进一步收紧国内开发者访问 GPT 等高水平大模型。国内开发者真是太难了。好...
最强大模型再次易主!Anthropic发布Claude3.5-Sonnet,多项评测超过GPT-4o,支持多模态!可免费使用!
直播预告 | 6月25日10点,「智猩猩AI新青年讲座」第241讲正式开讲,伊利诺伊大学厄巴纳-香槟分校在读博士赵晓明将直播讲解《从单目视频中合成动态新视图》,...
280亿颗晶体管!苹果M4芯片首发,AI算力高达38TOPS,宣战友商AI PC
最能打的AI PC芯片,iPad Pro首发。 作者|ZeR0 编辑|漠影 芯东西5月8日报道,周二晚间,苹果发布最新一代自研电脑芯片M4,新款iPad Pro首发。 苹果平台架构副...
硬核解决Sora的物理bug!美国四所顶尖高校联合发布:给视频生成器装个物理引擎
新智元报道编辑:LRS 【新智元导读】PhysDreamer利用材质点法(MPM)对物体的各个物理属性进行估计,实现了逼真的交互式响应结果,在视频生成领域向更真实的...
《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩
衡宇 梦晨 发自 凹非寺量子位 | 公众号 QbitAI等了7分多钟,刚从北京闪现闪离的马斯克,他终于夸我是个人才: 好了,别骂诈骗,我全都招! 现在登录通义App(...
消费级显卡轻松跑AI,英伟达RTX领跑AI PC竞争
克雷西 发自 凹非寺量子位 | 公众号 QbitAIAI PC的竞争,越来越火热了! 就连数据中心收入占比达到四分之三的英伟达,也用消费级的AI PC显卡领跑这场战斗。 ...
Llama 3每秒输出800个token逼宫openAI!下周奥特曼生日或放出GPT-5?
新智元报道编辑:桃子 Lumina 【新智元导读】Llama 3的开源,或将催生数十亿美元新产业。发布不到一周的时间,全网各种测试微调都开启了。甚至,Llama 3在Gro...
Llama提速500%!谷歌美女程序员手搓矩阵乘法内核
新智元报道编辑:alan 【新智元导读】近日,天才程序员Justine Tunney发推表示自己更新了Llamafile的代码,通过手搓84个新的矩阵乘法内核,将Llama的推理速度...
LLaMa 量化部署常用方案总结
,智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,阿里巴巴通义千问大模型技术负责人周畅,「清华系Sora」生数科技CEO唐家渝,云天励飞“...
OpenAI宿敌发布Claude 3 Haiku:速度最快,价格亲民|甲子光年
Anthropic形容它为:我们迄今为止最快的模型。编译|栗子 传闻中的GPT-4.5 Turbo暂时还没来,我们倒是先等来了Claude 3 Haiku。 北京时间3月14日,OpenAI最能...
Claude 3 Haiku发布:Anthropic迄今为止最快的模型
点击上方蓝字关注我们“Anthropic公司推出最新AI模型Claude 3 Haiku,以高速度和实惠的价格脱颖而出。Haiku不仅具备先进的视觉功能,还在处理速度上表现出色,...
苹果突然发布新款 MacBook Air ,最大亮点不是 M3 芯片
正式进入 M3 时代没有预告,没有发布会,苹果刚刚突然更新了 Macbook Air。 MacBook Air 最大的变化要属「换芯」,正式进入了 M3 时代。升级的 Air 配备了 8 ...