阿里发布下一代基础模型架构Qwen3-Next,开源基于该架构的Qwen3-Next-80B-A3B系列模型。该架构相比Qwen3的MoE模型结构有多项核心改进。Qwen3-Next-80B-A3B-Base模型有800亿参数,激活参数仅30亿,性能与Qwen3-32B dense模型相近甚至略好,训练成本不到Qwen3-32B的十分之一。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验