月之暗面Kimi携手清华等巨头,开源高性能大模型推理架构Mooncake
2024 年 11 月 28 日

月之暗面Kimi与清华大学MADSys实验室联合多家企业,推出了以KVCache为核心的Mooncake推理系统设计方案和开源项目。该技术采用PD分离和存换算架构,大幅提升推理吞吐量,已在全球开源社区上线。Mooncake项目旨在构建大模型推理架构,降低算力开销,为人工智能领域带来新机遇,并计划逐步开源高性能缓存和传输引擎,最终形成一套标准接口和实现方案。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟