当前位置: 网站首页 >AI教程资讯 >正文

TeleAI 视频生成大模型 – 中国电信AI研究院推出的视频生成模型

来源:爱论文 时间:2025-01-29 15:52:20

TeleAI 视频生成大模型是什么

TeleAI 视频生成大模型是中国电信AI研究院推出的视频生成模型,基于两阶段生成框架:先根据文本描述创建分镜头草图,再基于草图生成视频。TeleAI 视频生成大模型能确保视频中主体外观的一致性,精确控制动作和外观,实现复杂场景和动作的流畅过渡,遵循物理规律和常识。VAST技术在视频生成质量的多个维度上表现出色,特别是在主体一致性和遵循物理规律方面,在 VBench 测试中的人体动作和物体分类两项指标都拿下满分,为AI短剧创作提供强大的技术支持。

TeleAIshipinshengchengdamoxing

TeleAI 视频生成大模型的主要功能

视频生成:根据文本描述生成视频内容,保持主体外观的一致性。分镜头绘制:将文本描述转换成包含人物姿势、场景分布等关键信息的分镜头。精确控制:控制视频中主体的位置、动作和外观,实现复杂动作的精确模拟。遵循物理规律:确保视频中的动作和物体运动符合物理定律,避免扭曲变形。多场景连续性:在多个场景中保持目标主体的外观一致性,实现场景间的流畅切换。

TeleAI 视频生成大模型的技术原理

VAST技术:TeleAI视频生成大模型采用了“VAST(Video As Storyboard from Text)二阶段视频生成技术”。通过文本描述精准勾勒出包含视频构图、主体目标位置及人物姿态等关键信息的“故事板”(Storyboard),进而生成对应的视频内容。外观一致性和动作控制:得益于VAST技术,视频生成大模型能保证单个或多个主体人物在各视频片段中的外观一致性,实现对复杂动作和交互式动作的精确控制,让角色和目标物体的运动符合物理规律。全栈大模型能力:通过语义、语音、文生图、文生视频等全栈大模型能力,TeleAI视频生成大模型打通了短剧及影视制作的各个环节,覆盖文字脚本撰写、分镜脚本绘制、视频拍摄及剪辑、配音及音效合成等全流程,实现降本增效。

二阶段生成框架:TeleAI的视频模型通过两阶段生成框架——先画分镜,再生成视频,显著提升了短剧创作过程的可控性。第一阶段将文字描述转换成一系列分镜头,第二阶段根据这些分镜头生成视频画面,确保每个出招防守都准确到位,武打场面既符合物理规律,又富有观赏性。

TeleAI 视频生成大模型的应用场景

影视制作:生成电影或电视剧的初步剪辑版本,特别是在特效场景的制作上,减少实拍成本和风险,提高制作效率。广告行业:在广告制作中,根据产品特性快速定制动态广告内容,实现广告创意的快速原型设计和测试,适应市场变化。教育与培训:创建模拟场景进行安全教育和应急演练,制作教学视频,如科学实验、历史重现等,提高教育的互动性和趣味性。游戏开发:在游戏开发中,生成游戏内的动态剧情和过场动画,帮助游戏设计师快速原型设计,测试游戏剧情和角色互动。新闻与报道:快速生成新闻报道视频,提高新闻制作的效率,同时制作新闻背景视频,增强报道的视觉效果和信息传达。
上一篇:TPDM – 西湖大学联合北大等高校推出的时间预测扩散模型
相关资讯 更多+
  • TeleAI 视频生成大模型 – 中国电信AI研究院推出的视频生成模型
    TeleAI 视频生成大模型 – 中国电信AI研究院推出的视频生成模型

    TeleAI 视频生成大模型是中国电信AI研究院推出的视频生成模型,基于两阶段生成框架:先根据文本描述创建分镜头草图,再基于草图生成视频。TeleAI 视频生成大模型能确保视频中主体外观的一致性,精确控制动作和外观,实现复杂场景和动作的流畅过渡,遵循物理规律和常识。

    AI教程资讯 2023-04-14

  • TPDM – 西湖大学联合北大等高校推出的时间预测扩散模型
    TPDM – 西湖大学联合北大等高校推出的时间预测扩散模型

    TPDM(Time Prediction Diffusion Model)是西湖大学MAPLE实验室、南方科技大学、北京大学及西湖大学高等研究院先进技术研究所联合推出的图像生成模型,能自适应地调整去噪时间表,优化图像质量和生成效率。模型用即插即用的时间预测模块(TPM),在每个去噪步骤中根据当前隐空间特征预测下一个噪声水平。

    AI教程资讯 2023-04-14

  • ConsisID – 北大联合鹏城实验室等机构推出的文本到视频生成模型
    ConsisID – 北大联合鹏城实验室等机构推出的文本到视频生成模型

    ConsisID是北京大学和鹏城实验室等机构推出的文本到视频(Text-to-Video, IPT2V)生成模型,基于频率分解技术保持视频中人物身份的一致性。模型用免调优(tuning-free)的Diffusion Transformer(DiT)架构,结合低频全局特征和高频内在特征,用分层训练策略生成高质量、可编辑且身份一致性强的视频。

    AI教程资讯 2023-04-14

  • Perplexideez – 开源本地AI搜索助手,智能搜索信息来源追溯
    Perplexideez – 开源本地AI搜索助手,智能搜索信息来源追溯

    Perplexideez是本地AI助手,支持用户在网络和自托管应用中快速搜索信息。Perplexideez项目以Postgres数据库为基础,支持Ollama或OpenAI兼容的端点,用SearXNG实例进行网络搜索。Perplexideez具备多用户支持、单点登录(SSO)功能,并提供美观的搜索结果嵌入展示。

    AI教程资讯 2023-04-14

最新录入 更多+
确定