我要发布

蚂蚁集团开源全模态大模型Ming-flash-omni 2.0

2026-02-11 11:40:02 分享

2月11日，蚂蚁集团开源发布全模态大模型Ming-flash-omni 2.0。在多项公开基准测试中，该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出，部分指标超越Gemini 2.5 Pro。Ming-flash-omni 2.0也是业界首个全场景音频统一生成模型，可在同一条音轨中同时生成语音、环境音效与音乐。