亚马逊首个大型语音AI模型BASE TTS问世
2024 年 2 月 19 日

亚马逊人工智能研究团队开发了一项名为BASE TTS的文本转语音技术,该技术拥有9.8亿个参数,是有史以来最大的模型之一。BASE TTS使用了10万个小时的录音进行训练,包括英语、德语、荷兰语和西班牙语等,处理复杂的语言结构方面表现出色,单词发音质量得到了显著提升。尽管存在发音和语调错误等问题,这一技术仍标志着文本转语音技术的重要进展,未来可能得到广泛应用,但BASE TTS不会向公众发布,将仅用于学习应用中。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

物联网
icon订阅
科技
icon订阅
二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟