阿里云确认:李飞飞团队 s1 模型基于 Qwen2.5-32B-Instruct 模型训练
2 月 6 日

斯坦福大学和华盛顿大学的研究人员以低成本训练了人工智能推理模型 s1,其性能与 OpenAIo1DeepSeek 的 R1 等尖端模型相当。s1 模型基于阿里通义千问(Qwen)模型进行微调,阿里云确认了这一消息,并指出 s1-32B 模型在竞赛数学问题上的表现优于 o1-preview。Qwen 模型因其性能强劲、开源尺寸多样化和全球最大的衍生模型群,已成为开源社区中最重要的标杆基座模型。自 2023 年 8 月以来,阿里云开源了 Qwen 系列的 4 代模型,性能全球领先,Qwen 衍生模型数量已突破 9 万,超越 Llama 系列,成为世界最大的生成式语言模型族群。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟