阿里通义开源 Fun-CosyVoice3-0.5B,具备 zero-shot 音色克隆能力,提供 3 秒以上参考音频可复刻音色合成新语音,支持本地部署和二次开发。还推出轻量化版本 Fun-ASR-Nano 模型,总参数量压缩到 0.8B,推理成本更低,已开源,支持本地部署与定制化微调。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验