苹果公布 PCG 技术:质量零妥协、AI 语音生成提速 40%
前天

苹果公司与特拉维夫大学联合发表论文,提出「原则性粗粒度」(PCG)语音生成新方法,以解决 AI 文本转语音(TTS)技术的速度瓶颈。目前行业主流「自回归模型」采用「逐个预测」方式,因验证标准严苛拖慢生成速度。PCG 技术「求同存异」,建立「声学相似组」,将「单点验证」升级为「范围验证」,并引入「投机解码」策略,构建双模型协作架构,平衡了效率与准确性。应用该技术后,语音生成速度提升约 40%,未牺牲音频质量,且在极限压力测试中表现良好。PCG 属于「推理阶段」优化方案,无需重新训练现有模型,仅需约 37MB 额外内存存储声学相似组。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟