标签:加载

苹果极致LLM端侧方案:LLM in a flash

700个开发硬件免费申请➕现金大奖!生成式 AI、机器人 AI、PC AI 三大赛道!AMD Pervasive AI 开发者挑战赛报名火热进行中,扫码了解详情并报名~导读本文是知...
阅读原文

告别冷启动,LoRA成为大模型「氮气加速器」,提速高达300%

选自Raphael G 的博客 机器之心编译 作者:Raphael G 编辑:大盘鸡用 LoRA打造更快的 AI 模型。AI 模型功能越来越强大,结构也越来越复杂,它们的速度也成为...
阅读原文

CPU推理提升4到5倍,苹果用闪存加速大模型推理,Siri 2.0要来了?

机器之心报道 编辑:杜伟、蛋酱苹果这项新工作将为未来 iPhone 加入大模型的能力带来无限想象力。近年来,GPT-3、OPT 和 PaLM 等大型语言模型(LLM)在广泛的...
阅读原文

LLM推理飙升25倍!苹果超高效内存优化将大模型塞进iPhone,2秒视频生成逼真3D化身

新智元报道编辑:alan 【新智元导读】近日,苹果连发两篇论文,不仅能一键生成逼真的3D化身,而且还要把大模型装进你的iPhone想不想在你的iPhone上本地运行GP...
阅读原文