上海人工智能实验室联合浙江大学推出全球首个视频转网页评测基准 IWR-Bench,填补 AI 前端开发动态交互评测空白。该基准要求模型通过「视频 + 静态资源」重建网页交互,覆盖多场景,以 VFS 和 IFS 评估,匿名化资源、自动化测试贴近真实开发。对 28 款主流模型评测显示,GPT-5 综合得分 36.35 分,视频优化模型表现不及通用模型,「思考」机制提升有限。此基准将推动技术融合,未来或降低前端开发门槛。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验