加州大学伯克利分校 Sky Computing 实验室的 NovaSky 团队发布了开源推理模型 Sky-T1-32B-Preview,其性能与 OpenAI 的 o1 模型相当,但训练成本大幅降低至不到 450 美元。该模型使用合成数据训练,具备自我事实核查能力,尤其在物理、科学和数学等领域表现出高可靠性。Sky-T1 的训练数据由阿里巴巴的 QwQ-32B-Preview 生成,经过筛选和重构,使用 8 台 Nvidia H100 GPU 在 19 小时内完成训练。尽管在 GPQA-Diamond 测试中略逊于 o1 预览版,但 NovaSky 团队表示 Sky-T1 只是起点,未来将开发更高效的推理模型。