标签：速度

Mamba一作再祭神作，H100利用率飙至75%！FlashAttention三代性能翻倍，比标准注意力快16倍

新智元报道编辑：编辑部【新智元导读】时隔一年，FlashAttention又推出了第三代更新，专门针对H100 GPU的新特性进行优化，在之前的基础上又实现了1.5～2倍的...

阅读原文

AIGC动态

2年前 (2024)

英伟达又赚到了！FlashAttention3来了：H100利用率飙升至75%

机器之心报道编辑：陈陈、小舟740 TFLOPS！迄今最强 FlashAttention 来了。随着大型语言模型（LLM）加速落地，扩展模型上下文窗口变得越来越重要。然而，Tra...

阅读原文

AIGC动态

2年前 (2024)

Groq发布超快LLM引擎，速度让英伟达望尘莫及

点击上方蓝字关注我们“Groq公司最新推出的LLM引擎在速度和智能化方面取得突破，其响应速度达到每秒1256.54个token，远超Nvidia GPU，为AI应用部署提供了新的...

阅读原文

AIGC动态

2年前 (2024)

OpenAI停服，国产大模型免费用！开发者Token实现了

机器之心发布机器之心编辑部今天凌晨，OpenAI 突然宣布终止对中国提供 API 服务，进一步收紧国内开发者访问 GPT 等高水平大模型。国内开发者真是太难了。好...

阅读原文

AIGC动态

2年前 (2024)

最强大模型再次易主！Anthropic发布Claude3.5-Sonnet，多项评测超过GPT-4o，支持多模态！可免费使用！

直播预告 | 6月25日10点，「智猩猩AI新青年讲座」第241讲正式开讲，伊利诺伊大学厄巴纳-香槟分校在读博士赵晓明将直播讲解《从单目视频中合成动态新视图》，...

阅读原文

AIGC动态

2年前 (2024)

280亿颗晶体管！苹果M4芯片首发，AI算力高达38TOPS，宣战友商AI PC

最能打的AI PC芯片，iPad Pro首发。作者|ZeR0 编辑|漠影芯东西5月8日报道，周二晚间，苹果发布最新一代自研电脑芯片M4，新款iPad Pro首发。苹果平台架构副...

阅读原文

AIGC动态

2年前 (2024)

硬核解决Sora的物理bug！美国四所顶尖高校联合发布：给视频生成器装个物理引擎

新智元报道编辑：LRS 【新智元导读】PhysDreamer利用材质点法（MPM）对物体的各个物理属性进行估计，实现了逼真的交互式响应结果，在视频生成领域向更真实的...

阅读原文

AIGC动态

2年前 (2024)

《嬛嬛朕emo啦》但马斯克！阿里这项技术开放试玩

衡宇梦晨发自凹非寺量子位 | 公众号 QbitAI等了7分多钟，刚从北京闪现闪离的马斯克，他终于夸我是个人才：好了，别骂诈骗，我全都招！现在登录通义App（...

阅读原文

AIGC动态

2年前 (2024)

消费级显卡轻松跑AI，英伟达RTX领跑AI PC竞争

克雷西发自凹非寺量子位 | 公众号 QbitAIAI PC的竞争，越来越火热了！就连数据中心收入占比达到四分之三的英伟达，也用消费级的AI PC显卡领跑这场战斗。 ...

阅读原文

AIGC动态

2年前 (2024)

Llama 3每秒输出800个token逼宫openAI！下周奥特曼生日或放出GPT-5？

新智元报道编辑：桃子 Lumina 【新智元导读】Llama 3的开源，或将催生数十亿美元新产业。发布不到一周的时间，全网各种测试微调都开启了。甚至，Llama 3在Gro...

阅读原文

AIGC动态

2年前 (2024)

Llama提速500%！谷歌美女程序员手搓矩阵乘法内核

新智元报道编辑：alan 【新智元导读】近日，天才程序员Justine Tunney发推表示自己更新了Llamafile的代码，通过手搓84个新的矩阵乘法内核，将Llama的推理速度...

阅读原文

AIGC动态

2年前 (2024)

LLaMa 量化部署常用方案总结

，智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会，阿里巴巴通义千问大模型技术负责人周畅，「清华系Sora」生数科技CEO唐家渝，云天励飞“...

阅读原文

AIGC动态

2年前 (2024)

OpenAI宿敌发布Claude 3 Haiku：速度最快，价格亲民｜甲子光年

Anthropic形容它为：我们迄今为止最快的模型。编译｜栗子传闻中的GPT-4.5 Turbo暂时还没来，我们倒是先等来了Claude 3 Haiku。北京时间3月14日，OpenAI最能...

阅读原文

AIGC动态

2年前 (2024)

Claude 3 Haiku发布：Anthropic迄今为止最快的模型

点击上方蓝字关注我们“Anthropic公司推出最新AI模型Claude 3 Haiku，以高速度和实惠的价格脱颖而出。Haiku不仅具备先进的视觉功能，还在处理速度上表现出色，...

阅读原文

AIGC动态

2年前 (2024)

苹果突然发布新款 MacBook Air ，最大亮点不是 M3 芯片

正式进入 M3 时代没有预告，没有发布会，苹果刚刚突然更新了 Macbook Air。 MacBook Air 最大的变化要属「换芯」，正式进入了 M3 时代。升级的 Air 配备了 8 ...

阅读原文

AIGC动态

2年前 (2024)

123 4