亚马逊首个大型语音 AI 模型 BASE TTS 问世

2024 年 2 月 19 日

亚马逊人工智能研究团队开发了一项名为 BASE TTS 的文本转语音技术，该技术拥有 9.8 亿个参数，是有史以来最大的模型之一。BASE TTS 使用了 10 万个小时的录音进行训练，包括英语、德语、荷兰语和西班牙语等，处理复杂的语言结构方面表现出色，单词发音质量得到了显著提升。尽管存在发音和语调错误等问题，这一技术仍标志着文本转语音技术的重要进展，未来可能得到广泛应用，但 BASE TTS 不会向公众发布，将仅用于学习应用中。

亚马逊首个大型语音 AI 模型 BASE TTS 问世

搜狐科技 / 中关村在线

亚马智能逊人工团队开发出有史以来最大的文本转语音模型 BASE TTS

品玩

2026-03-31

亚马逊将推出机器人 AI 驱动的大型自动化零售门店

2026-03-20

亚马逊时隔 12 年重启智能手机项目：内部代号 Transformer

2025-10-24

亚马逊计划推出 AI 购物助手，帮助用户挑选商品

2025-07-03

亚马逊推出 Deep Fleet 模型，机器人数量突破百万

2025-04-09

亚马逊推出全新 AI 语音模型 Nova Sonic，叫板 OpenAI 和谷歌

2025-04-01

亚马逊发布新型 AI 模型可实现浏览器内自主操作

2025-02-27

亚马逊推出新版语音助手 Alexa+

2025-02-06

亚马逊 2 月 26 日发布新一代 Alexa 生成式 AI 服务，使用 Claude 模型

2025-01-31

亚马逊宣布将 DeepSeek-R1 模型纳入 Bedrock 人工智能模型市场

2024-11-28

亚马逊开发视频人工智能模型，减少对 Anthropic 的依赖

查看更多

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。