AIGC动态欢迎阅读
原标题:Llama 3 上线4天,井喷1000多个变种!中文版也有了!Groq上推理速度800token每秒
关键字:模型,芯片,中文,变体,乘法
文章来源:夕小瑶科技说
内容字数:2370字
内容摘要:
夕小瑶科技说 原创作者 | Zicy4月19号,Meta发布了其最新的大型语言模型Llama 3的早期版本,反响热烈,短短4天,就有了1000多个变种,而且这个数字还在持续增加…
井喷式变种19号凌晨,Meta发布的Llama 3可谓是向开源社区扔了一颗重磅,刚过4天,截至到目前4月23号上午10点,Hugging Face已经拥有了1013种Llama的变体,这个数字在21号晚上还是700多。有网友说Llama 3每分钟都在增长。
可是前几天不是刚过周末吗?
Hugging Face的联合创始人兼首席执行官Clem Delangue说到,到下周末可能将有10,000种变体可用!
而且Hugging Face的技术主管Philipp Schmid还贴心地发布了一份Llama 3-70B的微调指南,这个指南可以在他的个人网站上找到:
https://www.philschmid.de/fsdp-qlora-llama3
这份指南包括:设置开发环境、创建和准备数据集、使用PyTorch FSDP、Q-Lora和SDPA微调LLM以及测试模型和运行推理。
Llama 3中文版在Lla
原文链接:Llama 3 上线4天,井喷1000多个变种!中文版也有了!Groq上推理速度800token每秒
联系作者
文章来源:夕小瑶科技说
作者微信:xixiaoyaoQAQ
作者简介:专业、有趣、深度价值导向的科技媒体。聚集30万AI工程师、研究员,覆盖500多家海内外机构投资人,互联网大厂中高管和AI公司创始人。一线作者来自清北、国内外顶级AI实验室和大厂,兼备敏锐的行业嗅觉和洞察深度。商务合作:zym5189