标签:原版
Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练
梦晨 发自 凹非寺量子位 | 公众号 QbitAI大神Karpathy已经不满足于用C语言造Llama了! 他给自己的最新挑战:复现OpenAI经典成果,从基础版GPT-2开始。 挑战成...
58行代码把Llama 3扩展到100万上下文,任何微调版都适用
梦晨 发自 凹非寺量子位 | 公众号 QbitAI堂堂开源之王Llama 3,原版上下文窗口居然只有……8k,让到嘴边的一句“真香”又咽回去了。 在32k起步,100k寻常的今天...