智库
创投
产业服务
2月11日,蚂蚁集团开源发布全模态大模型Ming-flash-omni 2.0。在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越Gemini 2.5 Pro。Ming-flash-omni 2.0也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。
我是您的产业AI助手小PAI copilot
有问题试试问小PAI去提问>