阿里云确认:李飞飞团队 s1 模型基于 Qwen2.5-32B-Instruct 模型训练
2 月 6 日

斯坦福大学和华盛顿大学的研究人员以低成本训练了人工智能推理模型s1,其性能与OpenAIo1DeepSeek的R1等尖端模型相当。s1模型基于阿里通义千问(Qwen)模型进行微调,阿里云确认了这一消息,并指出s1-32B模型在竞赛数学问题上的表现优于o1-preview。Qwen模型因其性能强劲、开源尺寸多样化和全球最大的衍生模型群,已成为开源社区中最重要的标杆基座模型。自2023年8月以来,阿里云开源了Qwen系列的4代模型,性能全球领先,Qwen衍生模型数量已突破9万,超越Llama系列,成为世界最大的生成式语言模型族群。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟