智源:FlagOS 完成 DeepSeekV4 八款芯片 Day0 适配,实现三重技术突破
3 小时前
DeepSeek 发布 DeepSeek-V4-Pro 1.6T 旗舰模型及 DeepSeek-V4-Flash 284B 高效模型,智源研究院牵头研发的众智 FlagOS 对其进行全量适配,已完成 DeepSeek-V4-Flash 在 8 款以上 AI 芯片的适配与推理部署,正推进 DeepSeek-V4-Pro 迁移适配。DeepSeek-V4-Flash 采用混合专家架构,支持 100 万 token 上下文长度,在架构和预训练等方面有特点。FlagOS 围绕其多芯适配突破三大关键技术:FlagGems 全算子替代、为 o-group 采用独立张量并行策略、「FP4+FP8 混合精度」到 BF16 的精度转换。FlagGems 开源高性能新算子,支持新算子性能超原生。FlagOS 适配后的模型核心能力与原生版本对齐,部署极简。FlagOS 2.0 技术底座全链路支撑大模型跨芯适配,其包含高性能算子库 FlagGems、统一 AI 编译器 FlagTree、模型跨芯迁移发布工具 FlagRelease、统一多芯片接入插件 vLLM-plugin-FL。FlagOS 形成完整开源技术体系,为开发者提供跨芯适配支持。
2026-04-24
摩尔线程 MTT S5000 完成对 DeepSeek-V4-Flash 适配2026-04-24
海光 DCU 完成对 DeepSeek V4 极速适配2026-04-04
DeepSeek V4 优先支持国产 AI 芯片:巨头已开始提前抢货2026-02-26
DeepSeek 未让美芯片商测试 V4 模型 优先开放给国内厂商体验专业版特色功能,拓展更丰富、更全面的相关内容。