斯坦福大学和华盛顿大学的研究人员以低成本训练了人工智能推理模型 s1,其性能与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端模型相当。s1 模型基于阿里通义千问(Qwen)模型进行微调,阿里云确认了这一消息,并指出 s1-32B 模型在竞赛数学问题上的表现优于 o1-preview。Qwen 模型因其性能强劲、开源尺寸多样化和全球最大的衍生模型群,已成为开源社区中最重要的标杆基座模型。自 2023 年 8 月以来,阿里云开源了 Qwen 系列的 4 代模型,性能全球领先,Qwen 衍生模型数量已突破 9 万,超越 Llama 系列,成为世界最大的生成式语言模型族群。