Sky-T1

AI工具1年前 (2025)发布 AI工具集

Sky-T1 – NovaSky 开源的推理 AI 模型，可从零开始复现该模型

Sky-T1是加州大学伯克利分校Sky Computing实验室的NovaSky团队推出的一款开源推理人工智能模型，型号为Sky-T1-32B-Preview。这一模型的推出标志着开源推理模型的首次实现，所有训练数据和代码均已公开，用户能够从零开始复现该模型。Sky-T1的训练成本低于450美元，显著低于传统同类模型的数百万美元开销。其训练数据来源于阿里巴巴的QwQ-32B-Preview推理模型，通过精细筛选和重构，基于OpenAI的GPT-4o-mini进行处理，极大地提升了模型训练的高效性。在性能方面，Sky-T1在MATH500（一个“竞赛级”数学挑战集合）上的表现超越了OpenAI早期版本o1的预览版，并在LiveCodeBench的编程评估中也展现了优异的能力。

Sky-T1是什么

Sky-T1是由加州大学伯克利分校Sky Computing实验室的NovaSky研究团队发布的一款开源推理人工智能模型，型号为Sky-T1-32B-Preview。这是首个开源的推理模型，用户可以访问公开的训练数据集和代码，从零开始复现该模型。Sky-T1的训练成本不到450美元，远低于以往同类模型数百万美元的训练费用。其训练数据来源于阿里巴巴的QwQ-32B-Preview推理模型，经过精心筛选和重构，基于OpenAI的GPT-4o-mini进行处理，使得模型训练更加高效。在各项性能测试中，Sky-T1在MATH500数学挑战上表现优于OpenAI早期版本o1，同时在LiveCodeBench的编程评估中也名列前茅。

Sky-T1

Sky-T1的主要功能

开源特性：Sky-T1提供的训练数据集和代码完全开放，用户可以复现模型，促进了研究和开发的共享。
经济高效的训练：模型的训练成本低于450美元，显著降低了学习和开发的经济门槛。
卓越的推理能力：Sky-T1具备有效的自我事实核查能力，能够避免常见的推理陷阱，解决方案的生成可能需要几秒到几分钟不等，特别在物理、科学和数学领域表现出色。
优质的训练数据与硬件配置：Sky-T1的训练数据由阿里巴巴的QwQ-32B-Preview推理模型生成，经过精细筛选，基于OpenAI的GPT-4o-mini进行重构，提升了数据处理效率。该模型拥有320亿个参数，训练时间约为19小时，使用了8台Nvidia H100 GPU。
出色的性能表现：在MATH500数学挑战中，Sky-T1超越了OpenAI的o1早期预览版本，并在LiveCodeBench的编程评估中获得了优异成绩。

Sky-T1的项目地址

项目官网：https://novasky-ai.github.io/posts/sky-t1
HuggingFace模型库：https://huggingface.co/NovaSky-AI/Sky-T1-32B-Preview

Sky-T1的应用场景

数学问题解决：Sky-T1在MATH500数学挑战中的卓越表现使其在教育、科研及竞赛领域尤其适用，能有效解决复杂的数学问题。
编程评估：在LiveCodeBench的评估中，Sky-T1表现不俗，能够协助开发者进行代码生成、优化和错误检测，适合软件开发、编程教育及自动化测试等应用场景。
科学研究：尽管在GPQA-Diamond测试中（涵盖物理学、生物学和化学等研究生水平问题）表现稍逊于o1版本，但Sky-T1在物理、科学和数学领域的可靠性较高，为科学研究和学术探索提供了强有力的支持。

阅读原文