蚂蚁集团与 inclusion AI 联合推出 Ming-Omni 多模态模型,可处理图像、文本、音频和视频。该模型采用专用编码器提取 tokens,并通过 Ling 的 MoE 架构融合多模态输入,支持多样化任务。Ming-Omni 还具备音频和图像生成能力,可实现自然语音生成、高质量图像生成、上下文感知聊天及图像编辑等功能。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验