苹果公司与特拉维夫大学联合发表论文,提出「原则性粗粒度」(PCG)语音生成新方法,以解决 AI 文本转语音(TTS)技术的速度瓶颈。目前行业主流「自回归模型」采用「逐个预测」方式,因验证标准严苛拖慢生成速度。PCG 技术「求同存异」,建立「声学相似组」,将「单点验证」升级为「范围验证」,并引入「投机解码」策略,构建双模型协作架构,平衡了效率与准确性。应用该技术后,语音生成速度提升约 40%,未牺牲音频质量,且在极限压力测试中表现良好。PCG 属于「推理阶段」优化方案,无需重新训练现有模型,仅需约 37MB 额外内存存储声学相似组。