标签：权重

不用4个H100！340亿参数Code Llama在Mac可跑，每秒20个token，代码生成最拿手｜Karpathy转赞

新智元报道编辑：桃子【新智元导读】现在，34B Code Llama模型已经能够在M2 Ultra上的Mac运行了，而且推理速度超过每秒20个token，背后杀器竟是「投机采样」...

3年前 (2023)

谷歌证实大模型能顿悟，特殊方法能让模型快速泛化，或将打破大模型黑箱

新智元报道编辑：润好困【新智元导读】谷歌团队认为，模型泛化能力无处不在，只要摸清条件，模型就不是随机鹦鹉。在特定情况下，人工智能模型会超越训练数据...

3年前 (2023)

1…6 78