DeepSeek关联公司公布大语言模型部署方法专利
8 月 1 日

该专利提出了一种大语言模型的部署方法及系统,通过将预填充阶段和解码阶段分别部署在高性能计算能力和大内存的机器上,实现负载均衡,提高硬件利用率,减少算力闲置,降低延迟,提升吞吐量,并增强系统的扩展性和容错性。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。
二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟