Apple 发布 Pico-Banana-400K 数据集 助力文本引导图像编辑研究
上周三

Apple 近日发布 Pico-Banana-400K 数据集,含 40 万张精选图像,依托 Google Gemini-2.5 系列模型构建,相关研究论文同步公开。该数据集采用非商业研究许可,以 OpenImages 真实照片为基础,涵盖 35 种编辑类型,经生成、审核后包含单轮编辑、多轮编辑序列及成败结果偏好对。虽承认 Nano-Banana 有技术局限,但期望为下一代编辑模型提供训练与基准测试基础。研究论文可在 arXiv 查阅,数据集于 GitHub 免费开放。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟