月之暗面 Kimi 携手清华等巨头,开源高性能大模型推理架构 Mooncake
2024 年 11 月 28 日
月之暗面 Kimi 与清华大学 MADSys 实验室联合多家企业,推出了以 KVCache 为核心的 Mooncake 推理系统设计方案和开源项目。该技术采用 PD 分离和存换算架构,大幅提升推理吞吐量,已在全球开源社区上线。Mooncake 项目旨在构建大模型推理架构,降低算力开销,为人工智能领域带来新机遇,并计划逐步开源高性能缓存和传输引擎,最终形成一套标准接口和实现方案。
月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake
ZAKER/IT 之家 / 品玩
月之暗面 Kimi 携手清华等巨头,开源高性能大模型推理架构 Mooncake
ITBear 科技资讯
2025-11-08
月之暗面:Kimi K2 Thinking 智能推理能力超过 GPT-52025-10-31
月之暗面推出全新注意力架构 Kimi Linear2025-07-13
月之暗面发布万亿参数开源大模型 Kimi K22025-07-12
Kimi 开源万亿参数模型 K2:性能超全球主流开源模型2025-07-11
月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务2025-02-26
Kimi 组队清华获得 FAST 2025 最佳论文奖2025-01-20
Kimi 推出全新 k1.5 多模态思考模型,性能大幅领先2024-11-28
月之暗面 Kimi 携手清华等巨头,开源高性能大模型推理架构 Mooncake2024-10-12
第三届开源鸿蒙 OpenHarmony 技术大会明日开幕,将发布技术白皮书体验专业版特色功能,拓展更丰富、更全面的相关内容。