Stability AI开源AI图像生成模型Stable Diffusion 3 Medium

前方智能原创 2024-06-13 11:01 热度 5644

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

IP归属：广东

文章AI导读

一键萃取文章精髓，核心观点即刻呈现

# 梳理该事件的完整脉络

# 该文章有哪些有意思的观点或数据

# 大家对该事件的态度表现如何？

近日，生成型人工智能初创公司Stability AI宣布在其Stable Diffusion 3系列中发布该公司所谓的“最先进”的开源图像生成AI模型Stable Diffusion 3 Medium。

图源：Stability AI

SD3 Medium是一款20亿参数模型，可以快速理解涉及空间推理，构图元素，动作和风格的长而复杂的提示，支持逼真的图像制作等功能，通过16通道VAE等创新，成功解决了其他模型的常见缺陷，例如手部和面部的真实感。

SD3 Medium还特别关注模型准确生成单词和正确拼写文本的能力，实现了对文本质量的把控，减少拼写、字距调整、字母形成方面的错误。同时，模型VRAM占用空间小，适合在标准消费级GPU上运行，而不会降低性能。

为了加强其资源使用，Stability AI与英伟达合作，利用Nvidia RTX GPU和TensorRT提高包括SD3 Medium在内的所有稳定性扩散模型的性能，采用TensorRT内核的显卡可以提供50%的性能提升。此外，Stability AI 还与AMD合作。在公司的设备上优化了SD3 Medium的推理。

除了开放版本外，Stable Diffusion 3 Medium还可在由Fireworks AI提供支持的API上使用。其他版本的Stable Diffusion 3，如SD3 Large模型和SD3 Ultra也可以在Stable Assistant和Discord上通过Stable Artisan开始为期三天的免费试用。

SD3 人工智能图像生成开源模型生成式AI

陀螺科技现已开放专栏入驻，详情请见入驻指南： https://www.tuoluo.cn/article/detail-27547.html

前方智能专栏： https://www.tuoluo.cn/columns/author1911845/

本文网址： https://www.tuoluo.cn/article/detail-10113192.html

免责声明：
1、本文版权归原作者所有，仅代表作者本人观点，不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为，侵权责任将由作者本人承担。

上一篇：抖音618美妆品类爆发，直播电商有何奥秘？

下一篇：苹果与 OpenAI 合作揭秘，共赢合作不花一分钱