DragAnything是什么
DragAnything 是快手联合浙江大学和新加坡国立大学 Show Lab推出的,基于实体表示的可控视频生成方法,基于简单的轨迹输入实现对视频中任意物体的精确运动控制。DragAnything用扩散模型的潜在特征表示视频中的每个实体,克服传统方法中单纯拖动像素点无法精确控制物体运动的局限性。DragAnything 提供用户友好的交互方式,支持前景、背景及相机运动的灵活控制,在 FID、FVD 和用户研究等评估指标上达到新的最佳性能。

来源:爱论文 时间:2025-03-18 16:37:30
DragAnything 是快手联合浙江大学和新加坡国立大学 Show Lab推出的,基于实体表示的可控视频生成方法,基于简单的轨迹输入实现对视频中任意物体的精确运动控制。DragAnything用扩散模型的潜在特征表示视频中的每个实体,克服传统方法中单纯拖动像素点无法精确控制物体运动的局限性。DragAnything 提供用户友好的交互方式,支持前景、背景及相机运动的灵活控制,在 FID、FVD 和用户研究等评估指标上达到新的最佳性能。
DragAnything 是快手联合浙江大学和新加坡国立大学 Show Lab推出的,基于实体表示的可控视频生成方法,基于简单的轨迹输入实现对视频中任意物体的精确运动控制。DragAnything用扩散模型的潜在特征表示视频中的每个实体,克服传统方法中单纯拖动像素点无法精确控制物体运动的局限性。
AI教程资讯
2023-04-14
GENERator是阿里云飞天实验室 AI for Science 团队推出的生成式基因组基础模型,专注于 DNA 序列的设计和生成。模型基于 Transformer 解码器架构,具有 98k 碱基对的上下文长度和 12 亿参数,训练数据涵盖 3860 亿 bp 的真核生物 DNA。
AI教程资讯
2023-04-14
FoloUp 是开源的AI语音面试平台,能帮助企业高效地进行招聘面试。FoloUp能根据职位描述自动生成定制化的面试问题,基于AI技术与候选人进行自然、对话式的语音面试。平台能实时分析候选人的回答,生成详细的评分和洞察报告。
AI教程资讯
2023-04-14
ConsistentDreamer 是华为慕尼黑研究中心提出的新型图像到 3D 资产生成技术,通过单张图像生成视图一致的 3D 网格。方法通过多视图先验图像引导的高斯优化,解决了传统方法在多视图一致性上的不足。
AI教程资讯
2023-04-14