斯坦福大学和华盛顿大学的研究人员以低成本训练了人工智能推理模型s1,其性能与OpenAI的o1和DeepSeek的R1等尖端模型相当。s1模型基于阿里通义千问(Qwen)模型进行微调,阿里云确认了这一消息,并指出s1-32B模型在竞赛数学问题上的表现优于o1-preview。Qwen模型因其性能强劲、开源尺寸多样化和全球最大的衍生模型群,已成为开源社区中最重要的标杆基座模型。自2023年8月以来,阿里云开源了Qwen系列的4代模型,性能全球领先,Qwen衍生模型数量已突破9万,超越Llama系列,成为世界最大的生成式语言模型族群。