FlashInfer是一个用于大型语言模型服务的高性能GPU内核库。
Transformer-XL是一种超越固定长度上下文的注意力语言模型,支持单节点多GPU和多主机TPU训练,取得了最新的最佳结果。,Transformer-XL官网入口网址
总奖金超 233 万!
报名即将截止