Readhub

火山引擎发布豆包语音识别模型 2.0 提升多语种识别精度

2025 年 12 月 5 日

火山引擎推出豆包语音识别模型 2.0（Doubao-Seed-ASR-2.0），该版本在推理能力上显著提升，支持多种语言和视觉信息精准识别。它继承前作高性能音频编码器优势，优化复杂场景识别，依托先进 PPO 方案实现精准识别。具备多模态理解能力，可结合图像内容进行语音识别，避免偏差。支持 13 种海外语言，拓展跨语言应用。模型已上线并提供 API 服务，未来将持续进化，此次发布展示了其创新能力和技术实力，预计带来积极影响。

豆包语音识别模型 2.0 发布：能听懂字看懂图支持 13 种外语

站长之家

火山引擎发布豆包语音识别模型 2.0，强化多模态与多语言能力

品玩

豆包语音识别模型 2.0 上线：不仅「听懂字」还能「看懂图」，支持日韩德法等 13 种外语

IT 之家

展开全部报道

话题追踪

2025-12-23

传字节火山引擎成为 2026 年春晚独家 AI 云合作伙伴豆包也将参与

2025-12-18

豆包助手 API正式登陆火山方舟

2025-12-18

豆包大模型 1.8 正式发布日均调用量超过 50 万亿

2025-12-05

火山引擎发布豆包语音识别模型 2.0 提升多语种识别精度

2025-12-03

火山引擎：发布豆包图像创作模型 Seedream 4.5

2025-11-11

火山引擎发布豆包编程模型首月 9.9 元引领性价比潮流

2025-10-16

火山引擎发布豆包语音模型 2.0 实现语义与情感双突破

2025-09-30

豆包大模型 1.6-vision 正式发布

2025-09-17

火山引擎发布 PromptPilot，推动大模型应用高效落地

2025-07-30

豆包图像编辑模型 3.0 发布，扣子正式开源

查看更多

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。

行业标签

订阅

订阅

订阅

订阅

订阅

订阅

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

© 2026 NoCode 无码科技（杭州）有限公司浙ICP备17005035号-6 联系我们加入我们产品介绍

浙公网安备 33010902002965 号浙 B2-20181004

科技新闻，每天 3 分钟