当前位置: 网站首页 >AI教程资讯 >正文

SPAR3D – Stability AI等机构推出的单试图重建 3D 网络模型

来源:爱论文 时间:2025-01-13 11:30:32

SPAR3D是什么

SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的,先进的单图生成3D模型方法,能从单张图像中高效重建出高质量的3D对象。SPAR3D基于两阶段设计,第一阶段用点扩散模型生成稀疏的3D点云,第二阶段结合采样的点云和输入图像生成高度详细的网格。SPAR3D结合回归模型和生成模型的优势,能准确重建图像中的可见表面,又能合理生成被遮挡部分的几何和纹理细节。SPAR3D在多个数据集上表现出色,推理速度快,支持用户对生成网格的交互式编辑,为单视图3D重建任务提供一种实用且高效的解决方案。

SPAR3D

SPAR3D的主要功能

单视图3D重建:从单张2D图像中重建出高质量的3D网格模型,适用于增强现实、电影制作、制造业等需要3D建模的场景。快速推理:具有高效的推理速度,每个物体的重建时间仅需0.7秒,适合实时应用需求。支持用户编辑:生成的3D网格支持交互式编辑,用户基于修改点云调整未见表面的细节,如添加物体部件或改善局部细节,满足个性化需求。泛化能力强:不仅在标准数据集上表现优异,多图像和AI生成图像上实现准确的几何结构重建和良好的纹理效果,具有强大的泛化性能。

SPAR3D的技术原理

两阶段设计:点采样阶段:用轻量级的点扩散模型生成稀疏的3D点云。模型基于DDPM框架,用前向过程向原始点云添加噪声,再用后向过程中的去噪器学习去除噪声,生成包含XYZ和RGB信息的点云。点扩散模型的低分辨率特性使得采样速度快,且能初步捕捉物体的基本形状和颜色信息。网格化阶段:将采样的点云和输入图像作为条件,用大型三平面Transformer生成高分辨率的三平面特征。三平面特征用于估计物体的几何、纹理、光照以及材质属性(如金属度和粗糙度)。基于可微分渲染器进行训练,将预测的几何和材质渲染成图像,与真实图像进行比较,优化模型参数,生成与输入图像高度一致且细节丰富的3D网格。点云作为中间表示:点云作为连接两个阶段的桥梁,为网格化阶段提供必要的几何和颜色信息,支持用户在点云层面上进行编辑,增强模型的灵活性和可交互性。概率建模与逆渲染:在点采样阶段,基于概率建模处理单视图3D重建中的不确定性问题,生成合理的点云分布。在网格化阶段,进行逆渲染,将点云和图像信息融合,估计出物体的详细几何结构和材质属性,解决从单张图像中分离几何、光照和材质的难题。

SPAR3D的项目地址

项目官网:https://spar3dGitHub仓库:https://github.com/Stability-AI/stable-point-aware-3dHuggingFace模型库:https://huggingface.co/stabilityai/stable-point-aware-3darXiv技术论文:https://arxiv.org/pdf/2501.04689

SPAR3D的应用场景

家居设计:用户拍摄家中沙发照片,生成3D模型,在AR中预览不同风格沙发搭配效果,助力购买决策。电影制作:拍摄古堡遗址照片,生成古堡3D模型,特效团队在此基础上创作出符合剧情的宏伟古堡场景。工业设计:拍摄无人机原型照片,生成3D模型,设计师在模型上调整结构,优化无人机性能。游戏开发:拍摄森林照片,生成森林3D模型,开发者添加游戏元素,构建出森林探险场景。文物修复:拍摄破损佛像照片,生成3D模型,专家依此分析结构,制定修复方案,让佛像恢复原貌。
上一篇:Search-o1 – 人大联合清华推出自主知识检索增强的推理框架
相关资讯 更多+
  • 星火纪要 – 科大讯飞推出的会议交流总结和分析平台
    星火纪要 – 科大讯飞推出的会议交流总结和分析平台

    星火纪要是科大讯飞推出的集转录、总结、翻译、分析为一体的音视频处理平台,广泛应用于通用会议、访谈、销售、培训等场景。能帮助个人高效总结会议重点内容,提升工作学习效率;辅助企业从众多会议中洞察趋势与共性问题,进行更准确的组织决策。

    AI教程资讯 2023-04-14

  • Hallo3 – 复旦联合百度开源的高动态与真实感肖像动画生成框架
    Hallo3 – 复旦联合百度开源的高动态与真实感肖像动画生成框架

    Hallo3是复旦大学和百度公司联合推出的,基于扩散变换器网络(Diffusion Transformer Networks)的肖像图像动画技术,能生成高度动态和逼真的视频。Hallo3基于预训练的变换器视频生成模型,有效解决现有方法在处理非正面视角、动态对象渲染和生成沉浸式背景方面的挑战。

    AI教程资讯 2023-04-14

  • rStar-Math – 微软推出的小模型复杂推理与自进化SLMs的创新技术
    rStar-Math – 微软推出的小模型复杂推理与自进化SLMs的创新技术

    rStar-Math是微软亚洲研究院推出的创新研究项目,基于蒙特卡洛树搜索(MCTS)驱动的深度思考,使小型语言模型(SLMs)在数学推理方面达到甚至超越OpenAI大型模型的水平。rStar-Math不依赖于从更高级模型的数据蒸馏,而是用自我进化的深度思考提升模型性能。

    AI教程资讯 2023-04-14

  • SPAR3D – Stability AI等机构推出的单试图重建 3D 网络模型
    SPAR3D – Stability AI等机构推出的单试图重建 3D 网络模型

    SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的,先进的单图生成3D模型方法,能从单张图像中高效重建出高质量的3D对象。SPAR3D基于两阶段设计,第一阶段用点扩散模型生成稀疏的3D点云,第二阶段结合采样的点云和输入图像生成高度详细的网格。SPAR3D结合回归模型和生成模型的优势,能准确重建图像中的可见表面,又能合理生成被遮挡部分的几何和纹理细节。

    AI教程资讯 2023-04-14

最新录入 更多+
确定