蚂蚁集团与inclusion AI联合推出Ming-Omni多模态模型,可处理图像、文本、音频和视频。该模型采用专用编码器提取tokens,并通过Ling的MoE架构融合多模态输入,支持多样化任务。Ming-Omni还具备音频和图像生成能力,可实现自然语音生成、高质量图像生成、上下文感知聊天及图像编辑等功能。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验