中科曙光国家先进计算产业创新中心宣布,海光信息技术团队已完成DeepSeek V3和R1模型与海光DCU的国产化适配并上线。这些基于Transformer架构的模型采用MLA和DeepSeek MoE技术,降低内存占用并提升推理效率,优化模型性能。DCU是海光信息推出的高性能GPGPU架构AI加速卡,已在多个领域规模化应用。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验