DeepSeek开源周进度更新至4/5,本次开源了优化并行策略的项目,包括DualPipe双向管道并行算法和EPLB专家并行负载平衡器。DualPipe实现了正向和反向计算-通信阶段的完全重叠,减少了流水线气泡。EPLB用于V3/R1中专家并行的负载平衡,通过冗余专家策略和启发式方法分配复制的专家到GPU上,以保持负载平衡。同时,还分享了V3/R1中计算-通信重叠的分析数据,以帮助社区理解通信-计算重叠策略和底层实现细节。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验