当前位置: 网站首页 >AI教程资讯 >正文

GeneMAN – 上海AI Lab联合北大等高校推出的3D人体模型创建框架

来源:爱论文 时间:2025-01-29 21:27:49

GeneMAN是什么

GeneMAN是上海AI实验室、北京大学、南洋理工大学、上海交通大学联合推出的3D人形创建框架,能从单张图片中创建出高保真度的3D人体模型。框架不依赖于参数化人体模型,是用多源高质量人类数据集,包括3D扫描、多视角视频、单张照片和合成数据训练人类特定的2D和3D先验模型。GeneMAN基于几何初始化、雕刻流程和多空间纹理细化技术,实现从自然环境数据图像中提取高质量3D人体模型的目标,不论图像中的人体比例、姿势或服装如何变化。

GeneMAN

GeneMAN的主要功能

处理多样化的人体比例:无论图片中的人物是全身、半身还是特写,GeneMAN都能重建出相应的3D模型。适应不同的服装和姿势:GeneMAN能处理各种服装和人体姿势,包括自然姿势和常见物品。处理野外图像:GeneMAN特别擅长处理自然环境下的图像,即所谓的“野外数据”,这些图像可能包含多种复杂背景和光照条件。生成高质量的纹理:基于多空间纹理细化流程,GeneMAN能生成细节丰富、与输入图像一致的3D人体纹理。

GeneMAN的技术原理

2D和3D人类先验模型训练:文本到图像扩散模型:训练一个人类特定的文本到图像扩散模型,用在生成2D人类先验。视图条件扩散模型:训练一个视图条件扩散模型,用在生成3D人类先验。几何初始化与雕刻流程:无模板几何初始化:用NeRF(神经辐射场)技术初始化一个无模板的3D几何形状。结合先验与损失:结合GeneMAN的2D和3D先验及结构化差异损失(SDS损失)引导几何初始化。参考损失:用参考损失确保与输入图像的对齐。高分辨率细化:将NeRF转换为DMTet(深度多面体网格)进行高分辨率的几何细化,由预训练的人类特定的法线和深度适应扩散模型引导。多空间纹理细化流程:粗纹理生成:用多视图纹理技术生成粗略的纹理。潜在空间细化:在潜在空间中迭代细化纹理。像素空间细化:基于优化UV图在像素空间中获得详细纹理,用基于2D先验的ControlNet进行优化。

GeneMAN的项目地址

项目官网:roooooz.github.io/GeneMANGitHub仓库:https://github.com/roooooz/GeneMAN(即将开源)arXiv技术论文:https://arxiv.org/pdf/2411.18624

GeneMAN的应用场景

虚拟试衣:用户上传自己的全身照片,生成3D模型,用于在线试穿服装,提供更真实的试衣体验。游戏和娱乐:在游戏和电影制作中,创建或修改角色模型,提供更个性化和逼真的角色设计。增强现实(AR)和虚拟现实(VR):在AR和VR应用中,生成用户的3D化身,提高沉浸感和交互性。时尚设计:设计师快速将设计草图转换成3D模型,加速设计流程。健身和健康管理:基于分析用户的3D模型,提供个性化的健身指导和健康建议。
上一篇:MagicDriveDiT – 华为联合港中文等机构推出的自动驾驶高分辨率长视频生成方法
相关资讯 更多+
  • GeneMAN – 上海AI Lab联合北大等高校推出的3D人体模型创建框架
    GeneMAN – 上海AI Lab联合北大等高校推出的3D人体模型创建框架

    GeneMAN是上海AI实验室、北京大学、南洋理工大学、上海交通大学联合推出的3D人形创建框架,能从单张图片中创建出高保真度的3D人体模型。框架不依赖于参数化人体模型,而是用多源高质量人类数据集,包括3D扫描、多视角视频、单张照片和合成数据训练人类特定的2D和3D先验模型。

    AI教程资讯 2023-04-14

  • MagicDriveDiT – 华为联合港中文等机构推出的自动驾驶高分辨率长视频生成方法
    MagicDriveDiT – 华为联合港中文等机构推出的自动驾驶高分辨率长视频生成方法

    MagicDriveDiT是香港中文大学、香港科技大学、华为云和华为诺亚方舟实验室共同推出基于DiT架构的新型视频生成方法,专为自动驾驶应用设计,实现高分辨率和长视频的生成。基于流匹配增强模型的可扩展性,用渐进式训练策略处理复杂场景。

    AI教程资讯 2023-04-14

  • EfficientTAM – Meta AI推出的视频对象分割和跟踪模型
    EfficientTAM – Meta AI推出的视频对象分割和跟踪模型

    EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型,能解决SAM 2模型在移动设备上部署时的高计算复杂度问题。基于用简单的非层次化Vision Transformer(ViT)作为图像编码器,并引入高效的记忆模块降低计算复杂度,实现在保持分割质量的同时减少延迟和模型大小。

    AI教程资讯 2023-04-14

  • Amazon Nova – 亚马逊推出的全新大模型系列,覆盖文本、图像、视频生成领域
    Amazon Nova – 亚马逊推出的全新大模型系列,覆盖文本、图像、视频生成领域

    Amazon Nova 是亚马逊云服务(AWS)推出的新一代AI基础模型系列,提供行业领先的性能和成本效益。该系列包括专门处理文本的Amazon Nova Micro、多模态的Amazon Nova Lite 和Amazon Nova Pro,及即将推出的Amazon Nova Premier。除此之外,还有图像生成模型Amazon Nova Canvas 和视频生成模型Amazon Nova Reel。

    AI教程资讯 2023-04-14

最新录入 更多+
确定