Animate Anyone 2 – 阿里通义推出的高保真角色图像动画生成技术-爱论文

Animate Anyone 2是什么

Animate Anyone 2 是阿里巴巴集团通义实验室推出的高保真角色图像动画生成技术，通过结合环境信息生成更具真实感的角色动画。与传统方法不同，能从视频中提取运动信号，捕捉环境表示作为条件输入，使角色动画能与周围环境自然融合。通过“形状无关掩码策略”打破掩码区域与角色轮廓的对应关系，有效表征角色与环境的关系，减少形状泄漏问题。Animate Anyone 2 引入了“物体引导器”和“空间混合”技术，增强角色与物体交互的真实感；通过“深度姿态调制策略”，提升模型在复杂动作场景下的鲁棒性。

Animate Anyone 2的主要功能

高保真角色动画生成：Animate Anyone 2 能基于输入的角色图像和运动信号，生成高质量、连贯的角色动画视频。复杂动作处理：Animate Anyone 2 引入了“深度姿态调制策略”，模型能处理多样化和复杂的运动模式，增强在复杂动作场景下的鲁棒性，确保角色动作的自然性和合理性。动态人物交互：Animate Anyone 2 能生成角色之间的交互动画，确保角色之间的动作协调且与周围环境保持一致，为多角色场景提供更自然的动画效果。跨身份动画生成：能处理不同身份的角色动画，输入的角色图像与源视频中的角色不同，也能生成高质量的动画，具有良好的泛化能力。

Animate Anyone 2的技术原理

环境感知与融合：Animate Anyone 2 支持从源视频中提取运动信号，额外捕捉环境表示作为条件输入。环境被定义为角**域之外的区域，模型通过生成角色来填充这些区域，同时保持与环境背景的一致性。形状无关掩码策略：为了更有效地表征角色与环境之间的关系，提出一种“形状无关掩码策略”。通过在训练期间打破掩码区域与角色轮廓之间的对应关系，减少形状泄漏问题，更好地实现角色与环境的融合。物体交互增强：Animate Anyone 2 引入了“物体引导器”（Object Guider）来提取与角色交互的物体特征，通过“空间混合”（Spatial Blending）技术将这些特征注入生成过程中，增强角色与物体之间交互的真实感。深度姿态调制策略：为了处理多样化和复杂的运动模式，引入了“深度姿态调制策略”。通过增加结构化的深度信息来增强骨架信号，模型能更好地表示肢体之间的空间关系，在复杂动作场景下表现出更高的鲁棒性。基于扩散模型的框架：Animate Anyone 2 基于扩散模型构建，采用预训练的变分自编码器（VAE）将图像从像素空间转换到潜在空间，通过去噪网络逐步去除噪声，最终重建图像。

Animate Anyone 2的项目地址

项目官网：https://humanaigc.github.io/animate-anyone-2/arXiv技术论文：https://arxiv.org/pdf/2502.06145

Animate Anyone 2的应用场景

影视制作：在影视制作中，Animate Anyone 2 可以用于快速生成高质量的角色动画，支持角色替换、动作迁移等功能。广告与营销：在广告和营销领域，Animate Anyone 2 可以轻松实现视频中人物的替换和动作表情的无缝迁移。为品牌创造更具吸引力和个性化的广告内容，提升观众的参与度。虚拟现实（VR）和增强现实（AR）：在虚拟现实和增强现实应用中，Animate Anyone 2 可以生成与虚拟环境高度融合的角色动画。为用户提供更加沉浸式的体验。游戏开发：对于游戏开发，可以快速生成多样化的角色动画，支持角色与游戏环境的自然交互。提高开发效率，为玩家带来更加逼真的游戏体验。教育与培训：在教育和培训领域，Animate Anyone 2 可以用于创建个性化的虚拟角色，用于模拟教学场景或培训演示。增强学习的趣味性和效果。