智源开源多模态向量模型BGE-VL:多模态检索新突破
3 月 6 日

智源研究院联合多所高校开发了多模态向量模型BGE-VL,该模型在图文检索、组合图像检索等多模态检索任务中取得最佳效果。BGE-VL借助大规模合成数据MegaPairs训练而成,具有优异的可扩展性和卓越的数据质量。MegaPairs通过挖掘多模态三元组数据,以低成本生成多样化且高质量的数据,本次发布的版本涵盖2600万条样本。BGE-VL的技术报告已发布,相关数据、模型及代码资源将向社区开放。研究背景指出,信息检索需满足用户多样化需求,多模态检索器需综合理解图像和文本指令,从多模态信息中检索相关内容。MegaPairs构造分为挖掘多样图像对和合成开放域检索指令两个关键步骤。基于MegaPairs数据,智源训练出3款不同尺寸的多模态检索模型,显著提升主流多模态检索基准性能。未来,智源将继续探索MegaPairs与更多多模态检索场景结合,打造更全能通用的检索器。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟