幻方量化的AI公司DeepSeek发布了DeepSeek-R1模型,并开源了模型权重。该模型在后训练阶段使用强化学习技术,在少量标注数据的情况下提升了推理能力,性能与OpenAI o1相当。DeepSeek还开源了6个小模型,其中32B和70B模型性能对标OpenAI o1-mini。用户可通过官网或官方App调用DeepSeek-R1完成推理任务,API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。DeepSeek-R1训练技术已公开,模型开源License统一使用MIT,允许商用和模型蒸馏。