清华大学与巨人网络联合首创多方言语音合成框架,数据代码方法全开源
10 月 15 日

巨人网络 AI Lab 与清华大学电子工程系 SATLab 联合首创多方言语音合成大模型框架 DiaMoE-TTS 并全开源,以推动方言语音合成的公平与普惠。当前方言 TTS 是「灰色地带」,从业者和研究者面临缺乏统一语料构建方法和多语言端到端开源框架等难题。DiaMoE-TTS 是媲美工业级方言 TTS 模型的开源全套解决方案,基于统一的 IPA 表达体系,仅依赖开源方言 ASR 数据提出。该方案已在多语种场景验证,团队希望借此让小众语言与方言声音得到更广泛传承。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟