中国人工智能初创公司 DeepSeek 因使用华为芯片训练失败,推迟发布新 AI 模型 DeepSeek-R2。在研发过程中,DeepSeek 因在华为昇腾芯片上训练遇到持续性难题,最终决定改用英伟达芯片进行训练,但仍保留昇腾芯片用于推理任务。华为已派团队协助开发,但进度缓慢,主要问题包括芯片散热、平台稳定性、软硬件适配及通信速度等。尽管面临挑战,DeepSeek 仍与华为合作优化模型与昇腾平台的兼容性。此外,R2 模型未能如期发布,除技术问题外,还因创始人对模型表现不满意以及算力资源紧张等因素影响了进度。