当前位置: 网站首页 >AI教程资讯 >正文

PersonaCraft – 首尔国立大学推出的单参考图像生成多身份全身图像技术

来源:爱论文 时间:2025-01-29 17:58:18

PersonaCraft是什么

PersonaCraft是韩国首尔国立大学推出的个性化全身图像合成技术,结合扩散模型和3D人类建模,能从单一参考图像生成多个人物的逼真、个性化全身图像。PersonaCraft能有效处理人物间的遮挡问题,支持用户自定义身体形状调整,实现更灵活的个性化定制。基于精确控制身体姿态和形状,PersonaCraft在复杂场景中生成高质量图像方面表现出色,为多人图像合成树立了新标准。

PersonaCraft

PersonaCraft的主要功能

多人物图像合成:根据单一参考图像生成包含多个人物的逼真图像。遮挡处理:有效管理人物间的遮挡问题,确保图像中每个人物的身体部分都能准确展现。全身个性化:不仅关注面部身份的个性化,还能准确个性化每个人的全身形状。用户定义身体形状控制:用户根据个人喜好调整生成人物的身体比例和形状。3D感知姿态条件控制:用SMPLx-ControlNet(SCNet)进行3D感知的姿态条件控制,提高身体形状和姿态的准确性。

PersonaCraft的技术原理

3D人类建模与扩散模型结合:PersonaCraft整合3D人类建模(特别是SMPLx模型)和扩散模型,增强对人物身体形状和姿态的控制。SMPLx-ControlNet(SCNet):用SMPLx模型生成的深度图作为条件信号,准确捕捉身体形状和姿态,有效处理复杂的遮挡问题。面部和身体身份提取:基于InsightFace等技术从参考图像中提取面部身份嵌入,用SMPLx拟合方法提取身体形状参数。3D感知姿态条件:与传统的2D骨架姿势条件不同,PersonaCraft用3D姿势信息,提供更全面的人体姿势表示,包括深度信息。多人个性化图像合成:结合SCNet和IdentityNet,使用面部掩码准确定位身份,实现多人身份的个性化图像合成。

PersonaCraft的项目地址

项目官网:gwang-kim.github.io/persona_craftGitHub仓库:https://github.com/gwang-kim/PersonaCraftarXiv技术论文:https://arxiv.org/pdf/2411.18068

PersonaCraft的应用场景

社交媒体:用户根据喜好定制个人或与朋友一起的虚拟形象,用在社交媒体头像、虚拟空间中的代表形象等。广告与营销:品牌创建符合目标受众偏好的个性化广告图像,提高广告的吸引力和用户的共鸣。时尚与服装:在时尚行业中,展示服装在不同体型和身份的人物上的穿着效果,提供更加个性化的购物体验。游戏与娱乐:在游戏设计中,创建具有个性化外观的游戏角色,增强玩家的沉浸感和个性化体验。电影与动画制作:在电影或动画制作中快速生成或修改人物形象,提高制作效率并降低成本。
上一篇:StableAnimator – 复旦联合微软等机构推出的端到端身份一致性视频扩散框架
相关资讯 更多+
  • PersonaCraft – 首尔国立大学推出的单参考图像生成多身份全身图像技术
    PersonaCraft – 首尔国立大学推出的单参考图像生成多身份全身图像技术

    PersonaCraft是韩国首尔国立大学推出的个性化全身图像合成技术,结合扩散模型和3D人类建模,能从单一参考图像生成多个人物的逼真、个性化全身图像。PersonaCraft能有效处理人物间的遮挡问题,支持用户自定义身体形状调整,实现更灵活的个性化定制。

    AI教程资讯 2023-04-14

  • StableAnimator – 复旦联合微软等机构推出的端到端身份一致性视频扩散框架
    StableAnimator – 复旦联合微软等机构推出的端到端身份一致性视频扩散框架

    StableAnimator是复旦大学、微软亚洲研究院、虎牙公司和卡内基梅隆大学共同推出的端到端高质量身份保持视频扩散框架。StableAnimator能根据一张参考图像和一系列姿态,无需任何后处理工具,直接合成高保真度且保持人物身份一致性的视频。

    AI教程资讯 2023-04-14

  • I2V-01-Live – 海螺AI推出的图生视频模型,将静态图像转化为动态视频
    I2V-01-Live – 海螺AI推出的图生视频模型,将静态图像转化为动态视频

    I2V-01-Live是海螺AI推出的图生视频模型,能将静态二维图像转化为动态视频。模型基于深度学习技术,增强动作的流畅度和生动性,让人物或对象的动作更加自然和真实。I2V-01-Live支持多种艺术风格,优化稳定性和细腻的表现力,创作者用流畅性和精妙技巧,让艺术作品焕发生机。

    AI教程资讯 2023-04-14

  • Genie 2 – 谷歌DeepMind推出的最新一代基础世界模型
    Genie 2 – 谷歌DeepMind推出的最新一代基础世界模型

    Genie 2是DeepMind推出的新一代大规模基础世界模型,能仅凭一张图片生成长达1分钟的可交互3D游戏世界。Genie 2能模拟出物体交互、角色动画、物理效果等复杂动态,支持用键盘和鼠标进行操作。Genie 2具备长时间记忆功能,能记住且精确还原暂时离开视野的场景。

    AI教程资讯 2023-04-14

最新录入 更多+
确定