蚂蚁技术研究院推出 LLaDA2.0 系列离散扩散大语言模型(dLLM),并公开技术报告。此前开源的 LLaDA2.0 有 16B(mini)和 100B(flash)两个含 MoE 架构的版本,蚂蚁首次将 Diffusion 模型参数规模扩展到 100B 量级。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验