腾讯技术团队优化了 DeepSeek 开源的 DeepEP 通信框架,在 RoCE 网络环境下性能提升 100%,IB 网络环境下提升 30%。通过智能化带宽分配、解决 CPU 控制瓶颈以及引入 QP 内时序锁机制,显著提高了多 GPU 间的通信效率。该技术已全面开源并应用于腾讯混元大模型等项目,展现出卓越的通用性。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验