当前位置: 网站首页 >AI教程资讯 >正文

Cube 3D – Roblox 推出的 AI 3D 生成模型

来源:爱论文 时间:2025-04-21 11:53:50

Cube 3D是什么

Cube 3D 是 Roblox 推出的AI 3D生成大模型,基于 AI 技术高效生成 3D 模型和环境。Cube 3D支持直接从文本描述生成完整的 3D 对象,与游戏引擎兼容。Cube 3D能提高 3D 创作效率,减少手动建模时间,帮助开发者快速生成道具或设计空间。Cube 3D 的开源版本将支持开发者进行微调、插件开发或基于自身数据训练,满足个性化需求。Cube 3D 将与 Roblox 现有的 AI 工具集成,推动更沉浸式和个性化的用户体验。

Cube 3D

Cube 3D的主要功能

文本生成 3D 模型:用户输入文本描述快速生成 3D 网格模型。网格生成与优化:提供快速建模和优化功能,帮助开发者节省时间,快速迭代创意。场景布局与功能化:预测场景布局,生成具有实际功能的 3D 环境,如可进入的建筑。开源与定制:Cube 3D支持开源,开发者基于自身需求进行微调、扩展或开发插件。

Cube 3D的技术原理

3D 对象的“标记化”(Tokenization):借鉴自然语言处理中的“标记化”技术,将3D对象分解为一系列“形状标记”(shape tokens)。标记类似于语言中的单词,是构建复杂3D模型的基本单元。基于对形状标记的学习和预测,模型逐步构建出完整的3D对象。基于深度学习的预测模型:用深度学习算法,特别是生成式模型,对3D形状标记进行预测。模型学习大量的3D数据,理解不同形状之间的关系和组合方式,生成新的3D对象。原生3D数据训练:与传统的基于图像重建的3D生成方法不同,Cube 3D用原生的3D数据进行训练。递归布局预测:模型基于递归预测的方式,先确定场景的布局,再逐步填充各个部分的形状,最终构建出完整的3D环境。

Cube 3D的项目地址

项目官网:https://corp.roblox.com/newsroom/2025/03/introducing-roblox-cube

Cube 3D的应用场景

3D 游戏开发:快速生成游戏中的道具、角色、建筑和场景,减少手动建模时间,提升开发效率。虚拟环境设计:用在创建沉浸式的虚拟世界,如虚拟城市、主题公园或科幻场景,增强用户体验。教育与培训:生成教育场景和工具,如虚拟实验室、历史场景重现或工业模拟,帮助学生更好地理解和学习。社区创作与个性化体验:让用户基于简单的文本描述生成独特的3D内容,增强创作自由度和个性化体验。AI 辅助设计与原型开发:为设计师和开发者提供快速原型工具,快速迭代创意,优化设计流程。
上一篇:SmolDocling – 轻量级的多模态文档处理模型
相关资讯 更多+
  • Cube 3D – Roblox 推出的 AI 3D 生成模型
    Cube 3D – Roblox 推出的 AI 3D 生成模型

    Cube 3D 是 Roblox 推出的AI 3D生成大模型,基于 AI 技术高效生成 3D 模型和环境。Cube 3D支持直接从文本描述生成完整的 3D 对象,与游戏引擎兼容。Cube 3D能提高 3D 创作效率,减少手动建模时间,帮助开发者快速生成道具或设计空间。

    AI教程资讯 2023-04-14

  • SmolDocling – 轻量级的多模态文档处理模型
    SmolDocling – 轻量级的多模态文档处理模型

    SmolDocling(SmolDocling-256M-preview )是高效轻量级的多模态文档处理模型。能将文档图像端到端地转换为结构化文本,支持文本、公式、图表等多种元素识别,适用于学术论文、技术报告等多类型文档。

    AI教程资讯 2023-04-14

  • GR00T N1 – 英伟达开源的人形机器人基础模型
    GR00T N1 – 英伟达开源的人形机器人基础模型

    GR00T N1 是英伟达推出的全球首个开源基础模型,专为通用人形机器人设计。基于多模态输入(如语言和图像)实现多样化环境中的操作任务。GR00T N1 基于大规模人形机器人数据集训练,结合真实数据、合成数据和互联网视频数据,用后训练适应特定机器人形态、任务和环境。GR00T N1 基于双系统架构,视觉-语言模型负责推理和规划,扩散变换器则生成精确动作。

    AI教程资讯 2023-04-14

  • UniFluid – 谷歌联合麻省理工推出的多模态图像生成与理解框架
    UniFluid – 谷歌联合麻省理工推出的多模态图像生成与理解框架

    UniFluid 是谷歌 DeepMind 和麻省理工学院联合推出的,统一的自回归框架,用在联合视觉生成和理解任务。基于连续视觉标记处理多模态图像和文本输入,生成离散文本标记和连续图像标记。框架基于预训练的 Gemma 模型,用配对的图像-文本数据训练,让生成和理解任务相互促进。UniFluid 基于标准的 SentencePiece 作为文本标记器,用连续变分自编码器(VAE)作为图像生成的标记器,结合 SigLIP 图像编码器用在理解任务。

    AI教程资讯 2023-04-14

最新录入 更多+
确定