​Apple Intelligence是如何“练”成的?最全解读:模型架构、预训练、后训练、推理优化和评测

​Apple Intelligence是如何“练”成的?最全解读:模型架构、预训练、后训练、推理优化和评测

AIGC动态欢迎阅读

原标题:​Apple Intelligence是如何“练”成的?最全解读模型架构、预训练、后训练、推理优化和评测
关键字:模型,报告,数据,解读,摘要
文章来源:大数据文摘
内容字数:0字

内容摘要:


大数据文摘授权转载自学术头条
撰文:马雪薇Siri 终于变身“AI Siri”,万众期待的 Apple Intelligence 来了。伴随 Apple Intelligence 上线 iOS 18、iPadOS 18 和 macOS Sequoia,苹果也发布了自家大模型的技术报告,公布了大量技术细节,十分受业界关注。
据介绍,Apple Intelligence 包含了多个高效能的生成模型,它们快速、高效,专为用户日常任务而设计,并能即时适应用户当前的活动。构建到 Apple Intelligence 中的基础模型已经为用户体验进行了优化,如写作和润色文本、优先级排序和汇总通知、为与家人和朋友的对话创建有趣的图片,以及采取应用内操作以简化跨应用交互。
在技术报告中,苹果团队详细介绍了其中两个模型——一个约 30 亿参数的语言模型 AFM(Apple Foundation Model),以及一个更大的、基于服务器的 AFM-server 语言模型——是如何构建和适配的,从而高效、准确地执行专业任务。图|AFM 的模型概况
这两个基础模型是苹果创建的更大生成模型家族的一部分,用于支持用


原文链接:​Apple Intelligence是如何“练”成的?最全解读:模型架构、预训练、后训练、推理优化和评测

联系作者

文章来源:大数据文摘
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...