DeepSeek在知乎发布技术文章,介绍了其DeepSeek-V3/R1推理系统的优化细节,目标是提高吞吐量和降低延迟,通过大规模跨节点专家并行实现。文章还首次披露了理论成本和利润率信息,假设GPU租赁成本为2美金/小时,总成本为87,072美金/天,而按照DeepSeek R1的定价计算,一天的总收入可达562,027美金,理论利润率为545%。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验