腾讯技术团队优化了DeepSeek开源的DeepEP通信框架,在RoCE网络环境下性能提升100%,IB网络环境下提升30%。通过智能化带宽分配、解决CPU控制瓶颈以及引入QP内时序锁机制,显著提高了多GPU间的通信效率。该技术已全面开源并应用于腾讯混元大模型等项目,展现出卓越的通用性。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验