DeepSeek 联合清北发布论文:发力智能体底层基建,突破 Agent 推理 I/O 瓶颈
2 月 27 日
DeepSeek 与北大、清华在 ArXiv 发布论文,提出全新针对智能体的推理框架 DualPath。其核心是解决 Agent 长文本推理 I/O 瓶颈,通过引入「存储至解码」路径,改变传统单路径加载模式,实现集群存储带宽全局池化与动态负载均衡。在 660B 规模模型实测中,离线推理吞吐量提高 1.87 倍,在线服务吞吐量平均提升 1.96 倍,优化首字延迟且不影响 Token 间生成速度。DualPath 构建双路径模型,由推理引擎、流量管理器和中央调度器组成,还给出以计算网卡为中心的流量管理和自适应请求调度器两套优化方案。实验显示其能有效突破大模型推理 I/O 墙,提升智能体 LLM 推理系统效率。此外,论文第一作者是北大博士生吴永彤,他聚焦系统软件与大模型基础设施研究。
网卡别闲着啊!DeepSeek 用它加速智能体推理 效果杠杠的
快科技 / 凤凰科技
2026-01-21
DeepSeek 新模型曝光:MODEL1 代码预示新架构,最快有望 2 月发布2026-01-12
DeepSeek 将于春节前后发布新一代大模型 V4,主打代码生成能力2025-12-01
DeepSeek V3.2 正式版发布:强化 Agent 能力,融入思考推理2025-09-18
DeepSeek-R1 论文登上《自然》封面 梁文锋为通讯作者2025-08-21
DeepSeek-V3.1 正式发布2025-08-20
DeepSeek 小更新,多步推理表现提高 43%2025-05-31
百度 AI 搜索宣布全面接入 DeepSeek R1 最新版2025-04-30
DeepSeek 开源数学模型 Prover-V2-671B查看更多
体验专业版特色功能,拓展更丰富、更全面的相关内容。