智源:FlagOS 完成 DeepSeekV4 八款芯片 Day0 适配,实现三重技术突破

3 小时前

DeepSeek 发布 DeepSeek-V4-Pro 1.6T 旗舰模型及 DeepSeek-V4-Flash 284B 高效模型,智源研究院牵头研发的众智 FlagOS 对其进行全量适配,已完成 DeepSeek-V4-Flash 在 8 款以上 AI 芯片的适配与推理部署,正推进 DeepSeek-V4-Pro 迁移适配。DeepSeek-V4-Flash 采用混合专家架构,支持 100 万 token 上下文长度,在架构和预训练等方面有特点。FlagOS 围绕其多芯适配突破三大关键技术:FlagGems 全算子替代、为 o-group 采用独立张量并行策略、「FP4+FP8 混合精度」到 BF16 的精度转换。FlagGems 开源高性能新算子,支持新算子性能超原生。FlagOS 适配后的模型核心能力与原生版本对齐,部署极简。FlagOS 2.0 技术底座全链路支撑大模型跨芯适配,其包含高性能算子库 FlagGems、统一 AI 编译器 FlagTree、模型跨芯迁移发布工具 FlagRelease、统一多芯片接入插件 vLLM-plugin-FL。FlagOS 形成完整开源技术体系,为开发者提供跨芯适配支持。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。
科技新闻,每天 3 分钟