Stability AI开源AI图像生成模型Stable Diffusion 3 Medium

IP归属:广东

近日,生成型人工智能初创公司Stability AI宣布在其Stable Diffusion 3系列中发布该公司所谓的“最先进”的开源图像生成AI模型Stable Diffusion 3 Medium。

图源:Stability AI

SD3 Medium是一款20亿参数模型,可以快速理解涉及空间推理,构图元素,动作和风格的长而复杂的提示,支持逼真的图像制作等功能,通过16通道VAE等创新,成功解决了其他模型的常见缺陷,例如手部和面部的真实感。

SD3 Medium还特别关注模型准确生成单词和正确拼写文本的能力,实现了对文本质量的把控,减少拼写、字距调整、字母形成方面的错误。同时,模型VRAM占用空间小,适合在标准消费级GPU上运行,而不会降低性能。

为了加强其资源使用,Stability AI与英伟达合作,利用Nvidia RTX GPU和TensorRT提高包括SD3 Medium在内的所有稳定性扩散模型的性能,采用TensorRT内核的显卡可以提供50%的性能提升。此外,Stability AI 还与AMD合作。在公司的设备上优化了SD3 Medium的推理。

除了开放版本外,Stable Diffusion 3 Medium还可在由Fireworks AI提供支持的API上使用。其他版本的Stable Diffusion 3,如SD3 Large模型和SD3 Ultra也可以在Stable Assistant和Discord上通过Stable Artisan开始为期三天的免费试用。

陀螺科技现已开放专栏入驻,详情请见入驻指南: https://www.tuoluo.cn/article/detail-27547.html

前方智能专栏: https://www.tuoluo.cn/columns/author1911845/

本文网址: https://www.tuoluo.cn/article/detail-10113192.html

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

相关文章