DeepSeek V3.1 模型在生成文本时,会在不可预期的位置插入「极」「極」「extreme」三个 token,影响编程等对结构敏感的任务。问题在第三方 API 中较常见,官方网页端 FP8 全精度下也存在但概率较低。社区推测可能与训练数据清洗残留或模型「偷懒」机制有关,但部分案例仍无法解释。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验