DeepSeek 再开源力作:FP8 通用矩阵乘法库 DeepGEMM 助力 AI 高效运算
2 月 26 日

DeepSeek 在开源周活动中发布了 DeepGEMM,这是一个专为密集型和混合专家(MoE)通用矩阵乘法(GEMM)运算设计的 FP8 通用矩阵乘法库,支持 V3/R1 模型的训练和推理。DeepGEMM 在英伟达 Hopper 系列 GPU 上表现出色,FP8 TFLOPS 性能超过 1350,核心代码仅约 300 行,性能优于专家优化内核。它支持密集型布局和两种 MoE 布局,具备即时编译功能,提高开发效率和兼容性。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟