AIGC动态欢迎阅读
原标题:谈谈对OpenAI Triton的一些理解
关键字:工作,用户,知乎,侵权,指令
文章来源:智猩猩GenAI
内容字数:0字
内容摘要:
大会预告12月5日-6日,2024中国生成式AI大会(上海站)举办。将邀请50+位嘉宾围绕大模型、AI Infra、端侧生成式AI、AI视频生成和具身智能等议题进行同台分享和讨论。欢迎报名或购票。导读作者为杨军
原文来自知乎,地址:https://zhuanlan.zhihu.com/p/613244988
本文只做学术/技术分享,如有侵权,联系删文。01前言在AI系统领域,Triton其实是个有些歧义的名字,因为至少有两个足够有影响力的Triton相关的AI系统的工作,一个是NVIDIA用于在线服务布署的Triton Inference Server,另一个是由OpenAI发起的高层次Kernel开发语言Triton。
今天讨论的是后者。
大约在21年上半年,一个硬件公司的朋友给自己分享过Triton的工作,当时并没有很深刻的映象。第二次关注是在2022年上半年,因为一些机缘巧合,又接触到了Triton相关的内容,彼时Triton基于MLIR重构的工作刚刚开始,甚至整个架子都还没能跑通。正好自己一直在思考基于MLIR解决计算密集算子codegen问题的可能性,也对Triton这种高层
联系作者
文章来源:智猩猩GenAI
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...