当前位置: 网站首页 >AI教程资讯 >正文

AgiBot World – 智元机器人开源的百万真机数据集

来源:爱论文 时间:2025-01-17 11:03:35

AgiBot World是什么

AgiBot World是智元机器人开源的百万真机数据集,旨在推动具身智能的发展。数据集包含八十余种日常技能,覆盖家居、餐饮、工业等五大核心场景,数据规模和质量远超谷歌的Open X-Embodiment。基于智元自建的数据采集工厂和实验基地,通过8个摄像头和6个自由度的灵巧手等高级硬件配置,实现了全域真实场景的高质量数据采集。

AgiBot World的主要功能

多样化任务覆盖:AgiBot World数据集收录了八十余种日常生活中的多样化技能,从基础操作如抓取、放置、推、拉,到更复杂的动作如搅拌、折叠、熨烫等,几乎涵盖了日常生活所需的绝大多数动作需求。全域真实场景:数据集诞生于智元机器人自建的大规模数据采集工厂与应用实验基地,空间总面积超过4000平方米,包含三千多种真实物品,复刻了家居、餐饮、工业、商超和办公五大核心场景,为机器人提供了一个高度真实的生产生活环境。全能硬件平台:数据集采集所依托的机器人平台配备了8个摄像头环绕式布局,能够实时全方位感知周围环境的动态变化。机器人还具备6个主动自由度的灵巧手,能够完成熨衣服等多种复杂操作。全身最高32个自由度,末端六维力传感器和高精度视触觉传感器的配备,让机器人在面对精细操作任务时能够有条不紊。全程质量把控:智元机器人在AgiBot World的采集过程中采取了多级质量把控和全程人工在环的策略,从采集员的专业培训,到采集过程中的严格管理,再到数据的筛选、审核和标注,每一个环节都经过了精心设计和严格把控。数据集内容:AgiBot World收录了八十余种日常生活中的多样化技能,从基础操作如抓取、放置、推、拉,到复杂动作如搅拌、折叠、熨烫等,几乎涵盖了人类日常生活所需的绝大多数动作需求。开源计划:智元机器人计划陆续开源千万仿真数据,以支持更泛化和更通用的大模型训练;将发布具身基座大模型,可支持模型微调;发布全套工具链,实现采集、训练和评测闭环。

AgiBot World的项目地址

项目官网:agibot-world.comGithub仓库:https://github.com/OpenDriveLab/agibot-worldHuggingFace模型库:https://huggingface.co/agibot-world

AgiBot World的应用场景

家居场景:AgiBot World再现了人类真实住宅布局,包括卧室、客厅、厨房、卫生间等核心空间。在这些场景中,机器人可以执行家务清洁、物品整理和厨房任务等。餐饮场景:数据集中包含了餐饮相关的任务,如厨房中的搅拌、折叠等动作,以及可能的餐厅服务任务。工业场景:模拟分拣与物流自动化,复刻工业仓库与生产线,包括分拣系统、打包设备、传输带等。这有助于训练机器人实现物料分拣、包装打包、物流搬运等任务。商超场景:高度还原超市货架布局与收银区设计,包含生鲜、日用、冷冻等多个品类区域。这有助于训练机器人模拟物品上架、货物盘点、顾客引导、无人结算等。办公场景:涵盖了办公环境中可能需要机器人执行的任务,如文件整理、物品递送等。
上一篇:GraphAgent – 港大联合港科大开源的智能图形语言助手
相关资讯 更多+
  • AgiBot World – 智元机器人开源的百万真机数据集
    AgiBot World – 智元机器人开源的百万真机数据集

    AgiBot World是智元机器人开源的百万真机数据集,旨在推动具身智能的发展。数据集包含八十余种日常技能,覆盖家居、餐饮、工业等五大核心场景,数据规模和质量远超谷歌的Open X-Embodiment。

    AI教程资讯 2023-04-14

  • GraphAgent – 港大联合港科大开源的智能图形语言助手
    GraphAgent – 港大联合港科大开源的智能图形语言助手

    GraphAgent是香港大学和香港科技大学(广州)联合推出的智能图形语言助手,能处理现实世界中结构化(如图连接)和非结构化(如文本、视觉信息)格式的数据,数据包含复杂关系和相互依赖性,能用知识图谱展示。

    AI教程资讯 2023-04-14

  • DeepSeek Engineer – 开源AI编程助手,处理用户对话生成结构化JSON
    DeepSeek Engineer – 开源AI编程助手,处理用户对话生成结构化JSON

    DeepSeek Engineer 是集成DeepSeek API 的AI编程助手,基于命令行界面让用户能读取本地文件、创建新文件及实时对现有文件进行差异编辑。DeepSeek Engineer用 Pydantic 进行类型安全的文件操作,遵循系统提示确保所有回应都以 JSON 格式输出,同时支持文件的创建和编辑。DeepSeek Engineer 能帮助开发者在对话中引用文件内容,生成代码或提出差异编辑建议。

    AI教程资讯 2023-04-14

  • Psi R0 – 灵初智能推出的端到端具身模型
    Psi R0 – 灵初智能推出的端到端具身模型

    Psi R0是灵初智能发布的首个基于强化学习的端到端具身模型。支持双灵巧手协同进行复杂操作,能够将多个技能串联混训,生成具有推理能力的智能体,完成并闭环长程灵巧操作任务。

    AI教程资讯 2023-04-14

最新录入 更多+
确定