谈谈对OpenAI Triton的一些理解

AIGC动态2年前 (2024)发布智猩猩GenAI

AIGC动态欢迎阅读

原标题：谈谈对OpenAI Triton的一些理解
关键字：工作,用户,知乎,侵权,指令
文章来源：智猩猩GenAI
内容字数：0字

内容摘要：

大会预告12月5日-6日，2024中国生成式AI大会（上海站）举办。将邀请50+位嘉宾围绕大模型、AI Infra、端侧生成式AI、AI视频生成和具身智能等议题进行同台分享和讨论。欢迎报名或购票。导读作者为杨军
原文来自知乎，地址：https://zhuanlan.zhihu.com/p/613244988
本文只做学术/技术分享，如有侵权，联系删文。01前言在AI系统领域，Triton其实是个有些歧义的名字，因为至少有两个足够有影响力的Triton相关的AI系统的工作，一个是NVIDIA用于在线服务布署的Triton Inference Server，另一个是由OpenAI发起的高层次Kernel开发语言Triton。
今天讨论的是后者。
大约在21年上半年，一个硬件公司的朋友给自己分享过Triton的工作，当时并没有很深刻的映象。第二次关注是在2022年上半年，因为一些机缘巧合，又接触到了Triton相关的内容，彼时Triton基于MLIR重构的工作刚刚开始，甚至整个架子都还没能跑通。正好自己一直在思考基于MLIR解决计算密集算子codegen问题的可能性，也对Triton这种高层

原文链接：谈谈对OpenAI Triton的一些理解