Mu

Mu – 微软推出的小参数语言模型

Mu：一款由微软研发的小型语言模型，专为在NPU和边缘设备上高效运行而设计。它仅有3.3亿参数，却能以每秒超过100个tokens的速度响应用户指令，并支持将自然语言转化为系统操作。

### Mu：开启智能设置新篇章

您是否厌倦了在层层菜单中寻找系统设置？现在，有了Mu，这一切将变得轻松自如。这款由微软倾力打造的革新性语言模型，将彻底改变您与Windows系统的交互方式。Mu以其小巧的体积和强大的性能，在NPU和边缘设备上实现了高效运行，为用户带来了前所未有的便捷体验。

### Mu的核心功能：

### Mu的技术亮点：

架构基石：Mu基于编码器-解码器架构，通过编码器将输入文本转化为潜在表示，再由解码器生成输出，从而实现对自然语言的理解和处理。
硬件优化：针对NPU进行了深度优化，包括调整模型结构和参数，以适应硬件的并行性和内存限制，从而确保模型在NPU上的卓越性能。
模型量化：采用后训练量化（PTQ）技术，将模型权重和激活从浮点数转换为整数，有效减少模型内存占用和计算需求，同时保持模型的准确性。
Transformer技术创新：
- 双重层归一化：在每个子层前后分别进行LayerNorm操作，确保激活值分布良好，从而稳定训练过程。
- 旋转位置嵌入：基于复数域的旋转操作，动态生成位置编码，支持长序列的外推能力，避免了传统绝对位置编码的局限性。
- 分组查询注意力：基于在头组之间共享键和值，减少注意力参数数量和内存占用，保持头的多样性，从而提升模型效率。
训练策略：利用A100 GPU进行预训练，并从Phi模型进行知识蒸馏，结合低秩适配（LoRA）方法进行特定任务的微调，进一步提升模型性能。

### 产品官网：