PersonaCraft – 首尔国立大学推出的单参考图像生成多身份全身图像技术-爱论文

PersonaCraft是什么

PersonaCraft是韩国首尔国立大学推出的个性化全身图像合成技术，结合扩散模型和3D人类建模，能从单一参考图像生成多个人物的逼真、个性化全身图像。PersonaCraft能有效处理人物间的遮挡问题，支持用户自定义身体形状调整，实现更灵活的个性化定制。基于精确控制身体姿态和形状，PersonaCraft在复杂场景中生成高质量图像方面表现出色，为多人图像合成树立了新标准。

PersonaCraft的主要功能

多人物图像合成：根据单一参考图像生成包含多个人物的逼真图像。遮挡处理：有效管理人物间的遮挡问题，确保图像中每个人物的身体部分都能准确展现。全身个性化：不仅关注面部身份的个性化，还能准确个性化每个人的全身形状。用户定义身体形状控制：用户根据个人喜好调整生成人物的身体比例和形状。3D感知姿态条件控制：用SMPLx-ControlNet（SCNet）进行3D感知的姿态条件控制，提高身体形状和姿态的准确性。

PersonaCraft的技术原理

3D人类建模与扩散模型结合：PersonaCraft整合3D人类建模（特别是SMPLx模型）和扩散模型，增强对人物身体形状和姿态的控制。SMPLx-ControlNet（SCNet）：用SMPLx模型生成的深度图作为条件信号，准确捕捉身体形状和姿态，有效处理复杂的遮挡问题。面部和身体身份提取：基于InsightFace等技术从参考图像中提取面部身份嵌入，用SMPLx拟合方法提取身体形状参数。3D感知姿态条件：与传统的2D骨架姿势条件不同，PersonaCraft用3D姿势信息，提供更全面的人体姿势表示，包括深度信息。多人个性化图像合成：结合SCNet和IdentityNet，使用面部掩码准确定位身份，实现多人身份的个性化图像合成。

PersonaCraft的项目地址

项目官网：gwang-kim.github.io/persona_craftGitHub仓库：https://github.com/gwang-kim/PersonaCraftarXiv技术论文：https://arxiv.org/pdf/2411.18068

PersonaCraft的应用场景

社交媒体：用户根据喜好定制个人或与朋友一起的虚拟形象，用在社交媒体头像、虚拟空间中的代表形象等。广告与营销：品牌创建符合目标受众偏好的个性化广告图像，提高广告的吸引力和用户的共鸣。时尚与服装：在时尚行业中，展示服装在不同体型和身份的人物上的穿着效果，提供更加个性化的购物体验。游戏与娱乐：在游戏设计中，创建具有个性化外观的游戏角色，增强玩家的沉浸感和个性化体验。电影与动画制作：在电影或动画制作中快速生成或修改人物形象，提高制作效率并降低成本。