DeepSeek-R2 延迟推出或与华为芯片有关
8 月 14 日

中国人工智能初创公司 DeepSeek 因使用华为芯片训练失败,推迟发布新 AI 模型 DeepSeek-R2。在研发过程中,DeepSeek 因在华为昇腾芯片上训练遇到持续性难题,最终决定改用英伟达芯片进行训练,但仍保留昇腾芯片用于推理任务。华为已派团队协助开发,但进度缓慢,主要问题包括芯片散热、平台稳定性、软硬件适配及通信速度等。尽管面临挑战,DeepSeek 仍与华为合作优化模型与昇腾平台的兼容性。此外,R2 模型未能如期发布,除技术问题外,还因创始人对模型表现不满意以及算力资源紧张等因素影响了进度。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟