加州大学伯克利分校Sky Computing实验室的NovaSky团队发布了开源推理模型Sky-T1-32B-Preview,其性能与OpenAI的o1模型相当,但训练成本大幅降低至不到450美元。该模型使用合成数据训练,具备自我事实核查能力,尤其在物理、科学和数学等领域表现出高可靠性。Sky-T1的训练数据由阿里巴巴的QwQ-32B-Preview生成,经过筛选和重构,使用8台Nvidia H100 GPU在19小时内完成训练。尽管在GPQA-Diamond测试中略逊于o1预览版,但NovaSky团队表示Sky-T1只是起点,未来将开发更高效的推理模型。