月之暗面 Kimi 携手清华等巨头,开源高性能大模型推理架构 Mooncake
2024 年 11 月 28 日

月之暗面 Kimi 与清华大学 MADSys 实验室联合多家企业,推出了以 KVCache 为核心的 Mooncake 推理系统设计方案和开源项目。该技术采用 PD 分离和存换算架构,大幅提升推理吞吐量,已在全球开源社区上线。Mooncake 项目旨在构建大模型推理架构,降低算力开销,为人工智能领域带来新机遇,并计划逐步开源高性能缓存和传输引擎,最终形成一套标准接口和实现方案。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟