单图0.5秒生成,Stability AI与VAST开源3D模型“TripoSR”

IP归属:广东

编译/VR陀螺

近日,专注于视觉内容生成的模型公司Stability AI宣布与华人团队VAST开源了可单图生成 3D的AI模型“TripoSR”。

在Nvidia A100上进行测试时,TripoSR可以在大约0.5秒内生成草稿质量的3D输出(纹理网格),优于OpenLRM等其他开放图像到3D模型。除此之外,TripoSR在无需GPU的情况下也可以运行。

图源:Stability AI

据悉,TripoSR的灵感来自Adobe 2023年11月提出的LRM:单图像到3D的大型重建模型。这种新的图像到3D模型方法旨在满足娱乐、游戏、工业设计和建筑专业人士日益增长的需求,并提供用于可视化详细3D对象的响应式输出。

图源:Stability AI

Stability AI称,“我们对基本LRM模型进行了多项技术改进,包括通道号优化、蒙版监督和更高效的裁剪渲染策略。同时,我们还通过一个更高质量的Objaverse数据集子集训练数据,从而让TripoSR可以更接近地复制现实世界中的图像分布,显著提高模型的泛化能力。”

来源:stability.ai

陀螺科技现已开放专栏入驻,详情请见入驻指南: https://www.tuoluo.cn/article/detail-27547.html

VR陀螺专栏: https://www.tuoluo.cn/columns/author1286744/

本文网址: https://www.tuoluo.cn/article/detail-10111686.html

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

相关文章