CausVid是什么
CausVid是Adobe和MIT共同推出的自回归实时视频生成技术,能实现视频的即时播放。基于蒸馏预训练的双向扩散模型构建出自回归生成模型,减少视频生成的延迟,首帧延迟仅1.3秒,生成速度达到9.4帧/秒。CausVid突破传统视频生成模型的限制,支持多种应用,如文本到视频、图像到视频的生成,及视频风格转换等,为实时视频创作和编辑带来新的可能性。

来源:爱论文 时间:2025-01-27 09:47:20
CausVid是Adobe和MIT共同推出的自回归实时视频生成技术,能实现视频的即时播放。基于蒸馏预训练的双向扩散模型构建出自回归生成模型,减少视频生成的延迟,首帧延迟仅1.3秒,生成速度达到9.4帧/秒。CausVid突破传统视频生成模型的限制,支持多种应用,如文本到视频、图像到视频的生成,及视频风格转换等,为实时视频创作和编辑带来新的可能性。
CausVid是Adobe和MIT共同推出的自回归实时视频生成技术,能实现视频的即时播放。基于蒸馏预训练的双向扩散模型构建出自回归生成模型,减少视频生成的延迟,首帧延迟仅1 3秒,生成速度达到9 4帧 秒。CausVid突破传统视频生成模型的限制,支持多种应用。
AI教程资讯
2023-04-14
ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室共同推出的3D服装生成技术,能根据文本描述生成高保真、可穿戴的3D服装资产。ClotheDreamer用3D高斯为基础,基于Disentangled Clothe Gaussian Splatting (DCGS) 实现服装与人体分离优化,用双向Score Distillation Sampling (SDS) 提升服装渲染质量。
AI教程资讯
2023-04-14
Director是构建视频智能体的框架,用户能用自然语言命令执行复杂的视频任务,如视频搜索、编辑、合成和生成,并能即时流式传输结果。基于VideoDB的“视频即数据”基础设施,Director集成多个预构建的视频代理和AI API,提供基于聊天的用户界面,与视频内容的交互变得直观便捷。
AI教程资讯
2023-04-14
DeepSeek-V2 5-1210是DeepSeek 推出的 DeepSeek V2 系列收官AI模型,DeepSeek V2 5 的最终版微调模型。模型基于Post-Training迭代,在数学、编程、写作和角色扮演等方面实现能力提升(DeepSeek-V2 5-1210 在数学任务的完成率提升至82 8%,在实时编码得分提高至34 38%)。
AI教程资讯
2023-04-14