中国电信发布首个支持 30 种方言混说语音大模型
2024 年 5 月 25 日

中国电信人工智能研究院发布了一项名为「星辰超多方言语音识别大模型」的技术,该模型能够识别 30 多种方言,包括粤语、上海话、四川话和温州话等,这是国内支持方言种类最多的语音识别模型。研发团队通过采用「蒸馏 + 膨胀」联合训练算法,成功解决了大规模参数下的预训练问题,并实现了 1B 参数 80 层模型的稳定训练。此外,星辰语音大模型是业内首个开源的离散语音表征模型,通过新范式将语音传输比特率大幅降低,已在福建、江西、广西、北京、内蒙古等地中国电信的智能客服中试点应用。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

公司

中国电信icon arrowSH:601728HK:0072815 天前已发布三季报15 天前已发布三季报
二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟