Phi-3.5

AI工具2年前 (2024)发布 AI工具集

Phi-3.5是微软最新推出的AI模型系列，包含三个不同版本：Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct和Phi-3.5-vision-instruct。该系列模型旨在满足轻量级推理、混合专家系统和多模态任务的需求。Phi-3.5采用MIT开源许可证，具备多种参数规模，支持128k的上下文长度，优化了多语言处理及多轮对话能力，其性能在基准测试中超越了许多同类模型，如GPT4o、Llama 3.1和Gemini Flash。

Phi-3.5

Phi-3.5是什么

Phi-3.5系列是微软开发的新一代AI模型，专为满足不同应用场景的需求而设计。该系列包括Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct和Phi-3.5-vision-instruct，分别针对轻量级推理、混合专家架构和多模态任务，具有不同的参数规模和优化功能。

主要功能

Phi-3.5-mini-instruct
- 参数量：约38.2亿。
- 设计目的：专为遵循指令而优化，支持快速推理。
- 上下文支持：支持长达128k的token上下文，适合处理长文本。
- 适用场景：在内存或计算资源有限的环境中，进行代码生成、数学解题和逻辑推理等任务。
- 性能：在多语言和多轮对话任务中的表现突出，尤其在RepoQA基准测试中超越同类模型，如Llama-3.1-8B-instruct和Mistral-7B-instruct。
Phi-3.5-MoE-instruct
- 参数量：约419亿。
- 架构特点：混合专家架构，能有效整合多个专业模型处理不同任务。
- 上下文支持：同样支持128k token的上下文长度，适合复杂的多语言和多任务应用。
- 性能表现：在代码、数学及多语言理解方面表现优异，常在基准测试中优于大型模型。
- 多任务能力：在5-shot MMLU基准测试中，覆盖STEM、人文学科和社会科学等多个领域，超越GPT-40 mini。
Phi-3.5-vision-instruct
- 参数量：约41.5亿。
- 功能集成：集成文本和图像处理功能，支持多模态数据处理。
- 适用任务：特别适合图像理解、光学字符识别（OCR）、图表和视频摘要任务。
- 上下文支持：支持128k token的上下文，可以处理复杂的多帧视觉任务。