字节跳动近日推出 120 亿参数的多模态大语言模型 Vidi2,专注视频理解与生成,支持数小时长视频处理,能自动梳理叙事逻辑等并实现精准时空定位。它具备高精度时空定位等三大技术优势,能力已集成至 TikTok 产品。依托 TikTok 用户数据闭环,Vidi2 有望加速 AI 重构专业视频创作流程,推动相关方向发展。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验