Phi-3

AI工具2年前 (2024)发布 AI工具集

Phi-3是微软研究院推出的一款新一代小型语言模型系列，包括phi-3-mini、phi-3-small和phi-3-medium三个不同规模的版本。这些模型在参数规模较小的情况下，通过精心设计的训练数据和优化算法，展现出与大型模型相媲美的语言理解和推理能力，特别适合在移动设备上运行。

XX是什么

Phi-3是微软研究院开发的一系列先进的小型语言模型，旨在提升语言理解和推理能力。该系列包括三个不同版本：phi-3-mini、phi-3-small和phi-3-medium，分别适应不同的应用需求。尤其是phi-3-mini，具备3.8亿参数，能够在多项基准测试中超越许多参数更大的模型，且其小巧的设计使其可以在智能手机上运行，展示了小型化AI模型的巨大潜力。

Phi-3

技术报告：https://arxiv.org/abs/2404.14219

Hugging Face Phi-3模型地址：https://huggingface.co/collections/microsoft/phi-3-6626e15e9585a200d2d761e3

Ollama Phi-3模型地址：https://ollama.com/library/phi3

主要功能

phi-3-mini：作为最小版本，拥有3.8亿参数，尽管体积小，但在语言理解任务的基准测试中表现出色，与参数更多的模型如Mixtral 8x7B及GPT-3.5不相上下。它的设计使其能够在手机上运行，并在iPhone 14 Pro和15的A16芯片上实现每秒12个token的处理速度。
phi-3-small：具备7亿参数，使用tiktoken分词器支持多语言，增加了10%的多语言数据，表现优异，在MMLU测试中得分75.3%，超越了Meta的Llama 3 8B Instruct模型。
phi-3-medium：中型模型，参数达到14亿，经过更大数据集训练，在多个测试中表现优于GPT-3.5和Mixtral 8x7b MoE，在MMLU测试中得分78.2%，展现出强大的语言处理能力。