阿里发布下一代基础模型架构Qwen3-Next
上周五

阿里发布下一代基础模型架构Qwen3-Next,开源基于该架构的Qwen3-Next-80B-A3B系列模型。该架构相比Qwen3的MoE模型结构有多项核心改进。Qwen3-Next-80B-A3B-Base模型有800亿参数,激活参数仅30亿,性能与Qwen3-32B dense模型相近甚至略好,训练成本不到Qwen3-32B的十分之一。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟