当前位置: 网站首页 >AI教程资讯 >正文

WorldScore – 斯坦福大学推出的世界生成模型统一评估基准

来源:爱论文 时间:2025-04-15 17:41:57

WorldScore是什么

WorldScore 是斯坦福大学提出的用于世界生成模型的统一评估基准。将世界生成分解为一系列的下一个场景生成任务,通过明确的基于相机轨迹的布局规范来实现不同方法的统一评估。WorldScore 评估生成世界的三个关键方面:可控性、质量和动态性。基准包含精心策划的数据集,涵盖3000个测试样本,包括静态和动态、室内和室外、逼真和风格化的多样化世界。

WorldScore

WorldScore的主要功能

统一评估框架:WorldScore 提供了统一的评估框架,用于衡量不同世界生成模型的性能。将世界生成任务分解为一系列的下一个场景生成任务,通过明确的基于相机轨迹的布局规范来实现不同方法的统一评估。评估维度:从可控性、质量和动态性三个关键方面对生成的世界进行评估。多场景生成:WorldScore 是唯一支持多场景生成的基准测试,能评估模型在生成连续场景时的表现。统一性:能统一评估3D、4D、图像到视频(I2V)和文本到视频(T2V)模型,提供了一个全面的评估框架。长序列支持:支持生成多个场景,评估模型在长序列生成任务中的表现。图像条件:支持基于图像的条件生成,适用于图像到视频的生成任务。多风格:包含多种视觉风格的数据,能够评估模型在不同风格下的生成能力。相机控制:评估模型对相机轨迹的遵循能力,确保生成的场景符合指定的相机运动。3D一致性:评估场景在几何结构上的稳定性,确保生成的3D场景在不同视角下保持一致。

WorldScore的技术原理

多样化数据集:WorldScore 数据集包含动态和静态配置的多媒体数据,适用于图像到视频和图像到3D的任务。动态配置:包含图片、视觉运动、视觉风格、运动类型、风格、相机路径、物体和提示等字段。静态配置:包含图片、视觉运动、视觉风格、场景类型、类别、风格、相机路径、内容列表和提示列表等字段。数据集规模:数据集分为训练集和测试集,其中动态配置有1000个样本,静态配置有2000个样本。基于相机轨迹的布局规范:通过明确的基于相机轨迹的布局规范,实现不同方法的统一评估。多模态数据支持:支持多种模态的数据,包括图像、视频和3D模型,适用于多模态内容生成任务。

WorldScore的项目地址

项目官网:https://haoyi-duan.github.io/WorldScore/Github仓库:https://github.com/haoyi-duan/WorldScorearXiv技术论文:https://arxiv.org/pdf/2504.00983HuggingFace数据集:https://huggingface.co/datasets/Howieeeee/WorldScore

WorldScore的基准测试比较

WorldScore 在多个方面与其他现有基准测试有所不同,以下是详细的对比:

基准测试示例数量多场景统一性长序列图像条件多风格相机控制3D一致性TC-Bench150❌❌❌✅❌❌❌EvalCrafter700❌❌❌❌❌❌❌FETV619❌❌❌❌❌❌❌VBench800❌❌❌❌❌❌❌T2V-CompBench700❌❌❌❌❌❌❌Meng et al.160❌❌❌❌❌❌❌Wang et al.423❌❌✅❌❌❌❌ChronoMagic-Bench1649❌❌❌❌❌❌❌WorldModelBench350❌❌❌✅❌❌❌WorldScore3000✅✅✅✅✅✅✅

WorldScore的应用场景

图像到视频生成:通过生成高质量的视频内容,应用于视频制作、动画设计等领域。图像到3D生成:将2D图像转换为3D模型,用于虚拟现实、增强现实和3D建模等场景。数据集支持:数据集包含动态和静态配置的多媒体数据,适用于多种任务,帮助研究人员优化和改进模型。研究与开发:WorldScore 数据集为研究人员提供了标准化的测试平台,用于开发和验证新的3D/4D场景生成算法。自动驾驶场景生成:通过生成逼真的3D场景,用于自动驾驶系统的训练和测试,帮助提高自动驾驶系统的安全性和可靠性。
上一篇:PaperBench – OpenAI 开源的 AI 智能体评测基准
相关资讯 更多+
  • WorldScore – 斯坦福大学推出的世界生成模型统一评估基准
    WorldScore – 斯坦福大学推出的世界生成模型统一评估基准

    WorldScore 是斯坦福大学提出的用于世界生成模型的统一评估基准。将世界生成分解为一系列的下一个场景生成任务,通过明确的基于相机轨迹的布局规范来实现不同方法的统一评估。

    AI教程资讯 2023-04-14

  • PaperBench – OpenAI 开源的 AI 智能体评测基准
    PaperBench – OpenAI 开源的 AI 智能体评测基准

    PaperBench是OpenAI开源的AI智能体评测基准,支持评估智能体复现顶级学术论文的能力。PaperBench要求智能体从理解论文内容到编写代码、执行实验,全面展现从理论到实践的自动化能力。PaperBench包含8316个评分节点,基于层次化评分标准,用自动评分系统提高效率。

    AI教程资讯 2023-04-14

  • DreamActor-M1 – 字节跳动推出的 AI 图像动画框架
    DreamActor-M1 – 字节跳动推出的 AI 图像动画框架

    DreamActor-M1是字节跳动推出的先进AI图像动画框架,能将静态人物照片转化为生动的动画视频。采用混合引导机制,结合隐式面部表示、3D头部球体和3D身体骨架等控制信号,实现对人物面部表情和身体动作的精准控制。

    AI教程资讯 2023-04-14

  • Mini DALL·E 3 – 北京理工联合上海 AI Lab等高校推出的交互式文生图框架
    Mini DALL·E 3 – 北京理工联合上海 AI Lab等高校推出的交互式文生图框架

    Mini DALL·E 3 是北京理工大学、上海AI Lab、清华大学和香港中文大学联合推出的交互式文本到图像(iT2I)框架。基于自然语言与用户进行多轮对话,实现高质量图像的生成、编辑和优化。

    AI教程资讯 2023-04-14

最新录入 更多+
确定