DeepSeek已决定使用华为人工智能芯片训练部分模型,以减少对英伟达芯片的依赖。其最新发布的DeepSeek-V3.1采用混合推理架构,支持思考模式与非思考模式,并提升了模型的思考效率和Agent能力,优化了在工具使用与智能体任务中的表现。该模型采用UE8MO FP8 Scale参数精度,适配华为昇腾等芯片,提升稳定性和效率。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验