字节跳动推出视频生成模型OmniHuman-1.5
8 月 28 日

字节跳动推出视频生成模型OmniHuman-1.5,可基于单张图像和语音轨道生成与语音节奏、韵律及语义内容一致的角色动画,并支持通过文本提示优化效果。该模型受大脑认知理论启发,结合多模态大语言模型与扩散Transformer,实现长时间、动态、多角色互动的高质量视频生成。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟