阿里云确认：李飞飞团队 s1 模型基于 Qwen2.5-32B-Instruct 模型训练

2025 年 2 月 6 日

斯坦福大学和华盛顿大学的研究人员以低成本训练了人工智能推理模型 s1，其性能与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端模型相当。s1 模型基于阿里通义千问（Qwen）模型进行微调，阿里云确认了这一消息，并指出 s1-32B 模型在竞赛数学问题上的表现优于 o1-preview。Qwen 模型因其性能强劲、开源尺寸多样化和全球最大的衍生模型群，已成为开源社区中最重要的标杆基座模型。自 2023 年 8 月以来，阿里云开源了 Qwen 系列的 4 代模型，性能全球领先，Qwen 衍生模型数量已突破 9 万，超越 Llama 系列，成为世界最大的生成式语言模型族群。

阿里云确认：李飞飞团队 s1 模型基于 Qwen2.5-32B-Instruct 模型训练

IT 之家

李飞飞团队「50 美元」复刻 DeepSeek 的 R1？阿里云：基于 Qwen2.5-32B-Instruct 模型训练

华尔街见闻 / 钛媒体

李飞飞团队新作，爆火的 DeepSeek，为什么都选择 Qwen 作为基座模型？

爱范儿

展开全部报道

2026-03-19

阿里吴泳铭：ATH 事业群优先打造智能能力最强的模型

2026-02-24

千问 3.5 登顶 Hugging Face，前十开源模型中国占据 8 席

2026-02-04

阿里千问发布 Qwen3-Coder-Next：低推理成本编程智能体模型

2025-12-31

源 Yuan 3.0 Flash 基础大模型开源发布

2025-10-17

李飞飞团队发布世界模型最新成果

2025-09-24

阿里通义发布 Qwen3-Max，其迄今为止规模最大、能力最强的模型

2025-07-31

阿里通义千问推出新模型 Qwen3-30B-A3B-Thinking-2507

2025-06-23

阿里云推出自动驾驶模型训练推理加速框架，训练时间可缩短 50%

2025-04-09

阿里云为地平线端到端智驾大模型训练提供算力支持

2025-03-11

广州算力中心接入阿里通义千问大模型

查看更多

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。