阿里云确认：李飞飞团队 s1 模型基于 Qwen2.5-32B-Instruct 模型训练

2025 年 2 月 6 日

斯坦福大学和华盛顿大学的研究人员以低成本训练了人工智能推理模型 s1，其性能与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端模型相当。s1 模型基于阿里通义千问（Qwen）模型进行微调，阿里云确认了这一消息，并指出 s1-32B 模型在竞赛数学问题上的表现优于 o1-preview。Qwen 模型因其性能强劲、开源尺寸多样化和全球最大的衍生模型群，已成为开源社区中最重要的标杆基座模型。自 2023 年 8 月以来，阿里云开源了 Qwen 系列的 4 代模型，性能全球领先，Qwen 衍生模型数量已突破 9 万，超越 Llama 系列，成为世界最大的生成式语言模型族群。

IT 之家

李飞飞团队「50 美元」复刻 DeepSeek 的 R1？阿里云：基于 Qwen2.5-32B-Instruct 模型训练

华尔街见闻 / 钛媒体

李飞飞团队新作，爆火的 DeepSeek，为什么都选择 Qwen 作为基座模型？

爱范儿

展开全部报道

专业版功能

体验专业版特色功能，拓展更丰富、更全面的相关内容。