苹果公布 PCG 技术：质量零妥协、AI 语音生成提速 40%

2 月 3 日

苹果公司与特拉维夫大学联合发表论文，提出「原则性粗粒度」（PCG）语音生成新方法，以解决 AI 文本转语音（TTS）技术的速度瓶颈。目前行业主流「自回归模型」采用「逐个预测」方式，因验证标准严苛拖慢生成速度。PCG 技术「求同存异」，建立「声学相似组」，将「单点验证」升级为「范围验证」，并引入「投机解码」策略，构建双模型协作架构，平衡了效率与准确性。应用该技术后，语音生成速度提升约 40%，未牺牲音频质量，且在极限压力测试中表现良好。PCG 属于「推理阶段」优化方案，无需重新训练现有模型，仅需约 37MB 额外内存存储声学相似组。