DeepSeek近日升级了其模型至V3.1版本,提升了推理能力、上下文处理能力和多语言支持。该版本模型拥有5600亿参数,处理复杂任务的能力增强,多步推理表现提高43%。上下文长度达128k,可处理10万到13万汉字,相当于一部完整的中长篇小说。模型减少产生不实信息的情况,提高了信息准确性,并能处理超过100种语言。然而,备受关注的DeepSeek R2版本因训练中遇到的问题,其发布被推迟。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验