中科曙光国家先进计算产业创新中心宣布,海光信息技术团队已完成 DeepSeek V3 和 R1 模型与海光 DCU 的国产化适配并上线。这些基于 Transformer 架构的模型采用 MLA 和 DeepSeek MoE 技术,降低内存占用并提升推理效率,优化模型性能。DCU 是海光信息推出的高性能 GPGPU 架构 AI 加速卡,已在多个领域规模化应用。
行业标签
公司
更多体验
前往小程序
24 小时
资讯推送
进群体验