华泰证券研究指出,DeepSeek V3通过使用PTX优化硬件算法,展现出与CUDA解耦的趋势,为适配更多算力芯片打下基础。NSA采用Triton编程语言,可高效编写GPU代码,支持多种GPU语言。尽管LLM训练尚未完全脱离CUDA生态,但DeepSeek NSA的推出为后续适配更多算力芯片提供了可能。国产算力如异腾已适配DeepSeek-R1等国产模型,并取得高效推理效果。随着海外算力受限,国产算力优化有望持续进展,值得关注。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验