微软 AI 宣布推出首个完全自研的文本生成图像模型 MAI-Image-1,并在 LMArena 的文本到图像榜单中进入前十。官方称该模型由 Microsoft AI 团队独立设计与训练,重点优化真实光影与自然场景的呈现,同时提升生成速度,相较于“更大、更慢的模型”响应更快,便于创作者快速迭代与转入后续专业工具。
图源:微软
图源:微软
微软表示,MAI-Image-1 在数据筛选与评估上更贴近真实创作场景,并引入创意行业专业人士的反馈,旨在避免重复或“千篇一律”的风格化输出,实现更高的视觉多样性与实用价值。微软称该模型在光线效果(如反射、反弹光)、风景与写真类图像生成方面表现突出。
目前 MAI-Image-1 已在 LMArena 开始测试以收集安全与负责任使用方面的反馈,微软称该模型将“很快”在 Microsoft Copilot 与 Bing Image Creator 中向更广泛用户开放。微软近年加速自研模型布局,继今年 8 月发布 MAI-Voice-1 与 MAI-1-preview 后,再次强化其在多模态生成领域的产品线。与此同时,微软与 OpenAI 的合作关系趋于多元化,部分 Microsoft 365 功能已采用 Anthropic 的模型,显示其在模型供给上走向组合策略与自主可控。