亚马逊人工智能研究团队开发了一项名为BASE TTS的文本转语音技术,该技术拥有9.8亿个参数,是有史以来最大的模型之一。BASE TTS使用了10万个小时的录音进行训练,包括英语、德语、荷兰语和西班牙语等,处理复杂的语言结构方面表现出色,单词发音质量得到了显著提升。尽管存在发音和语调错误等问题,这一技术仍标志着文本转语音技术的重要进展,未来可能得到广泛应用,但BASE TTS不会向公众发布,将仅用于学习应用中。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验