当前位置: 网站首页 >AI教程资讯 >正文

Edify 3D – NVIDIA 推出的3D生成模型

来源:爱论文 时间:2025-02-01 22:03:19

Edify 3D是什么

Edify 3D 是 NVIDIA 推出的先进3D资产生成方案,能从文本提示或参考图像快速合成高质量的3D模型。Edify 3D能在两分钟内生成具有详细几何形状、清晰拓扑结构、高分辨率纹理和PBR材质的3D资产,支持视频游戏设计、扩展现实、模拟等多个领域应用。这一技术结合多视图扩散模型和基于Transformer的重建模型,显著提高3D内容生产的效率和可扩展性。

Edify 3D

Edify 3D的主要功能

文本到3D生成:根据输入的文本描述,生成具有详细几何形状、清晰拓扑结构、高分辨率纹理和PBR材质的3D资产。图像到3D生成:能从参考图像中自动识别前景对象,并生成相应的3D资产。快速生成:在不到2分钟的时间内生成高质量的3D资产,满足快速生产的需求。高分辨率纹理:支持生成高达4K分辨率的纹理,确保生成资产的视觉质量。PBR材质支持:生成的3D资产包含基于物理的渲染(PBR)材质,让资产在不同光照条件下都能保持逼真的外观。UV贴图和材质图:生成的资产包括有组织的UV贴图和材质图,便于后续的编辑和渲染。

Edify 3D的技术原理

多视图扩散模型:用多视图扩散模型合成对象的RGB外观和表面法线图像。这些模型能处理文本提示和相机姿态,从多个视点合成对象的外观。Transformer基础重建模型:基于合成的多视图RGB和表面法线图像,用Transformer模型预测3D形状的几何、纹理和材质。该模型将3D对象表示为潜在的标记(latent tokens),基于等值面提取和网格处理来得网格几何。跨视图注意力机制:多视图扩散模型扩展自注意层,跨不同视点进行注意力分配,提高视点一致性。高分辨率上采样:用上采样ControlNet提高多视图RGB图像的分辨率,基于给定3D网格的纹理和表面法线进行条件化处理。PBR渲染:在生成过程中应用基于物理的渲染技术,确保材质和光照效果的真实性。网格后处理:生成的3D网格经过后处理,包括重新拓扑为四边形网格、UV映射生成和PBR属性烘焙,适应艺术和设计需求。

Edify 3D的项目地址

项目官网:research.nvidia.com/labs/dir/edify-3darXiv技术论文:https://arxiv.org/pdf/2411.07135

Edify 3D的应用场景

视频游戏设计:游戏开发者快速生成一个中世纪城堡的3D模型,包括城墙、塔楼和内部结构,及相应的纹理和材质,用于即将推出的策略游戏。扩展现实(XR):虚拟现实体验设计师创建一个逼真的海底世界,包括各种海洋生物和珊瑚礁,为潜水爱好者提供一个沉浸式的虚拟潜水体验。电影和视频制作:电影制作团队生成一个未来城市的3D场景,用于科幻电影中的关键追逐戏,其中包括摩天大楼、飞行汽车和异形植物。模拟和训练:军事训练模拟器中,生成复杂的城市环境和战场地形,供士兵进行战术训练和模拟实战。建筑和城市规划:城市规划师根据最新的城市设计草案,快速生成3D城市模型,包括新的住宅区、商业中心和公园,以便进行公众展示和反馈收集。
上一篇:SongCreator – AI音乐模型,能理解、生成和编辑歌曲
相关资讯 更多+
  • Edify 3D – NVIDIA 推出的3D生成模型
    Edify 3D – NVIDIA 推出的3D生成模型

    Edify 3D 是 NVIDIA 推出的先进3D资产生成方案,能从文本提示或参考图像快速合成高质量的3D模型。Edify 3D能在两分钟内生成具有详细几何形状、清晰拓扑结构、高分辨率纹理和PBR材质的3D资产,支持视频游戏设计、扩展现实、模拟等多个领域应用。

    AI教程资讯 2023-04-14

  • SongCreator – AI音乐模型,能理解、生成和编辑歌曲
    SongCreator – AI音乐模型,能理解、生成和编辑歌曲

    SongCreator是清华大学深圳国际研究生院、香港中文大学等机构推出的AI音乐生成模型,能从歌词出发生成包含声乐和伴奏的完整歌曲。

    AI教程资讯 2023-04-14

  • Teacher2Task – 谷歌推出的多教师学习框架
    Teacher2Task – 谷歌推出的多教师学习框架

    Teacher2Task是谷歌团队推出的多教师学习框架,引入教师特定的输入标记和重新构思训练过程,消除对手动聚合启发式方法的需求。框架不依赖聚合标签,将训练数据转化为N+1个任务,包括N个辅助任务预测每位教师的标记风格,及一个主要任务关注真实标签。

    AI教程资讯 2023-04-14

  • DynaSaur – Adobe 推出的大语言模型代理框架
    DynaSaur – Adobe 推出的大语言模型代理框架

    DynaSaur是Adobe Research推出的大型语言模型(LLM)代理框架,突破传统LLM代理系统受限于预定义动作集合的限制。框架支持代理动态创建和组合动作,基于生成和执行Python代码与环境互动,实现更灵活的问题解决。DynaSaur能积累生成的动作,构建可重用的函数库,提高未来任务的效率和适应性。

    AI教程资讯 2023-04-14

最新录入 更多+
确定