马斯克旗下的人工智能公司xAI近日推出了首个多模态模型Grok-1.5 Vision,该模型不仅能理解文本,还能处理文档、图表、截图和照片中的内容。在多学科推理、文档理解、科学图表、表格处理、屏幕截图和照片等多个领域,Grok-1.5 Vision的表现可媲美现有的前沿多模态模型。在RealWorldQA基准测试中,Grok-1.5 Vision的成绩比GPT-4V、Claude 3Sonnet、Claude 3 Opus和Gemini Pro 1.5等主流竞争对手更为优异。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验