当前位置: 网站首页 >AI教程资讯 >正文

Genesis – CMU 联合 20 多所研究机构开源的生成式物理引擎

来源:爱论文 时间:2025-01-22 13:56:47

Genesis是什么

Genesis是卡内基梅隆大学、马里兰大学、斯坦福大学、麻省理工学院等研究机构联合推出的开源生成式物理引擎,能模拟世界万物。Genesis能用简单的语言描述,快速生成精确的物理模拟,包括物体运动、人物动作和机器人策略等。引擎的特点在于高度的物理准确性、快速的模拟速度(比现实世界快约430000倍),及用户友好的Python化设计。Genesis能模拟各种材料和物理现象,提供一个轻量级、超快速的机器人仿真平台,及一个强大而快速的照片级写实渲染系统。Genesis能将用户的自然语言描述转换为数据模式,用在生成式数据引擎。Genesis为通用机器人、具身AI和物理AI应用而设计,预示着物理模拟和机器人技术领域的重大进步。

Genesis

Genesis的主要功能

物理模拟:模拟各种材料和物理现象,包括物体的运动、碰撞、流体动力学等。机器人仿真:提供轻量级、超快速的机器人仿真平台,支持多种机器人类型,如机械臂、腿式机器人、无人机、软体机器人等。照片级渲染:拥有强大而快速的照片级写实渲染系统,能生成高质量的视觉输出。生成式数据引擎:将用户的自然语言描述转换为数据模式,用在生成模拟场景。交互式3D场景:支持完全交互式的3D场景生成,包括家居室内场景、游戏环境等。开放世界物体生成:能生成开放世界中的铰接式物体,提供高质量的mesh资产。软体机器人模拟:针对软性机器人实现逼真的模拟,如蠕虫、柔软的抓手等。面部动画和语音同步:生成面部动作和表情,与语音同步,实现逼真的面部动画。

Genesis的技术原理

通用物理引擎:从头开始构建,集成各种物理求解器,如刚体、MPM(物质点方法)、SPH(光滑粒子流体动力学)、FEM(有限元方法)、PBD(位置基动力学)等,实现精确的物理模拟。生成Agent框架:在核心物理引擎之上运行,用在自动化数据生成,包括视频、摄像机运动、角色动作、机器人策略等。可微分仿真:支持可微分仿真,让仿真过程与机器学习算法结合,用在训练和优化。多模态集成:将物理模拟与视觉渲染、动作捕捉、语音合成等多模态技术集成,实现全面的模拟体验。跨平台兼容性:设计为可在不同操作系统和计算后端(如CPU、Nvidia GPU、AMD GPU、Apple Metal)上运行。

Genesis的项目地址

项目官网:genesis-embodied-ai.github.ioGitHub仓库:https://github.com/Genesis-Embodied-AI/Genesis

Genesis的应用场景

机器人仿真训练:模拟复杂环境,训练机器人在现实世界中执行任务。游戏物理引擎:在游戏开发中,创建逼真的物理效果和角色动作。电影特效制作:模拟逼真的物理破坏和动态效果,用在电影后期制作。科学研究模拟:在物理学和工程学研究中,模拟实验和测试理论。虚拟教学平台:在教育领域,创建虚拟实验室,辅助物理和科学教学。
上一篇:AniDoc – 2D动画上色AI模型,基于视频扩散模型自动将草图序列转换成彩色动画
相关资讯 更多+
  • Genesis – CMU 联合 20 多所研究机构开源的生成式物理引擎
    Genesis – CMU 联合 20 多所研究机构开源的生成式物理引擎

    Genesis是卡内基梅隆大学、马里兰大学、斯坦福大学、麻省理工学院等研究机构联合推出的开源生成式物理引擎,能模拟世界万物。Genesis能用简单的语言描述,快速生成精确的物理模拟,包括物体运动、人物动作和机器人策略等。

    AI教程资讯 2023-04-14

  • AniDoc – 2D动画上色AI模型,基于视频扩散模型自动将草图序列转换成彩色动画
    AniDoc – 2D动画上色AI模型,基于视频扩散模型自动将草图序列转换成彩色动画

    AniDoc是香港科技大学、蚂蚁集团、南京大学、浙江大学和香港大学共同推出的简化2D动画上色AI模型,基于视频扩散模型自动将草图序列转换成彩色动画,遵循参考角色设计。模型用对应匹配技术处理角色设计与草图之间的差异,实现色彩和风格的准确传递。

    AI教程资讯 2023-04-14

  • ElevenLabs Flash – ElevenLabs推出的低延迟语音合成模型
    ElevenLabs Flash – ElevenLabs推出的低延迟语音合成模型

    ElevenLabs Flash是ElevenLabs推出的低延迟语音合成模型,专为快速对话型AI设计。ElevenLabs Flash有两个版本:Flash v2仅支持英语,Flash v2 5支持32种语言。ElevenLabs Flash模型以每两个字符消耗1信用点的成本提供服务,音质和情感深度略低于Turbo模型,延迟显著降低。

    AI教程资讯 2023-04-14

  • StyleStudio – 文本驱动的风格迁移模型,能将参考图像的风格与文本提示内容融合
    StyleStudio – 文本驱动的风格迁移模型,能将参考图像的风格与文本提示内容融合

    StyleStudio是西湖大学AI实验室、复旦大学、南洋理工大学和香港科技大学(广州)联合推出的,文本驱动的风格迁移模型,能将参考图像的风格与文本提示的内容融合。StyleStudio基于三种策略解决风格过拟合、控制限制和文本错位问题:跨模态AdaIN机制增强风格与文本特征整合;基于风格的分类器自由引导(SCFG)支持选择性控制风格元素;及教师模型用在早期生成阶段稳定空间布局,减少伪影。

    AI教程资讯 2023-04-14

最新录入 更多+
确定