SpAItial公司发布用于实时3D场景生成的Echo-2

IP归属:广东

文章AI导读

一键萃取文章精髓,核心观点即刻呈现

编译/VR陀螺

近日,物理世界模型开发商SpAItial宣布推出最新前沿模型“Echo-2”,该模型可根据文本或图像输入,生成可通过任何设备实时探索的沉浸式3D环境,区别于传统序列视频模型,具备独特优势。

与逐帧预测的序列视频模型不同,Echo-2可通过单个图像或文本提示生成空间持久的3D场景,规避了传统模型计算需求高、几何漂移、输出不一致等问题。其网页演示采用3D高斯喷溅(3DGS)技术渲染,具备GPU友好型性能,即便在配置一般的硬件上,也可在浏览器中实现交互式观看。

该模型可连接多行业物理与数字环境,应用场景广泛:机器人领域支持Sim2Real知识迁移,助力机器人在模拟环境中训练后安全部署;游戏开发中可快速生成可导航3D环境,方便开发者快速搭建游戏原型;建筑和房地产领域可将2D平面图转换为3D场景,生成虚拟布置和交互式漫游,且无需昂贵3D扫描硬件。

Echo-2还具备场景理解和编辑功能,可生成语义分割掩码识别场景物体,支持通过文本提示添加、移除或替换物体,适用于室内设计等场景。据悉,该模型在WorldScore世界生成基准的三项指标上,均优于World Labs的“Marble-1.1”模型。

SpAItial表示,Echo-2未来版本将融入动力学和基于物理的推理,进一步支持交互式模拟和高级机器人训练。

来源:auganix

陀螺科技现已开放专栏入驻,详情请见入驻指南: https://www.tuoluo.cn/article/detail-27547.html

VR陀螺专栏: https://www.tuoluo.cn/columns/author1286744/

本文网址: https://www.tuoluo.cn/article/detail-10128558.html

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。