华泰证券:DeepSeek有望加速模型训练与CUDA解耦
2 月 21 日

华泰证券研究指出,DeepSeek V3通过使用PTX优化硬件算法,展现出与CUDA解耦的趋势,为适配更多算力芯片打下基础。NSA采用Triton编程语言,可高效编写GPU代码,支持多种GPU语言。尽管LLM训练尚未完全脱离CUDA生态,但DeepSeek NSA的推出为后续适配更多算力芯片提供了可能。国产算力如异腾已适配DeepSeek-R1等国产模型,并取得高效推理效果。随着海外算力受限,国产算力优化有望持续进展,值得关注。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

证券
icon订阅
处理器
icon订阅
财经
icon订阅
科技
icon订阅
二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟