Apple Intelligence是如何“练”成的？最全解读：模型架构、预训练、后训练、推理优化和评测

AIGC动态1年前 (2024)发布大数据文摘

AIGC动态欢迎阅读

原标题：Apple Intelligence是如何“练”成的？最全解读：模型架构、预训练、后训练、推理优化和评测
关键字：模型,报告,数据,解读,摘要
文章来源：大数据文摘
内容字数：0字

内容摘要：

大数据文摘授权转载自学术头条
撰文：马雪薇Siri 终于变身“AI Siri”，万众期待的 Apple Intelligence 来了。伴随 Apple Intelligence 上线 iOS 18、iPadOS 18 和 macOS Sequoia，苹果也发布了自家大模型的技术报告，公布了大量技术细节，十分受业界关注。
据介绍，Apple Intelligence 包含了多个高效能的生成模型，它们快速、高效，专为用户日常任务而设计，并能即时适应用户当前的活动。构建到 Apple Intelligence 中的基础模型已经为用户体验进行了优化，如写作和润色文本、优先级排序和汇总通知、为与家人和朋友的对话创建有趣的图片，以及采取应用内操作以简化跨应用交互。
在技术报告中，苹果团队详细介绍了其中两个模型——一个约 30 亿参数的语言模型 AFM（Apple Foundation Model），以及一个更大的、基于服务器的 AFM-server 语言模型——是如何构建和适配的，从而高效、准确地执行专业任务。图｜AFM 的模型概况
这两个基础模型是苹果创建的更大生成模型家族的一部分，用于支持用

原文链接：Apple Intelligence是如何“练”成的？最全解读：模型架构、预训练、后训练、推理优化和评测