当前位置: 网站首页 >AI教程资讯 >正文

HUGWBC – 上海交大联合上海 AI Lab 推出的人形机器人全身控制器

来源:爱论文 时间:2025-03-20 15:12:02

HUGWBC是什么

HUGWBC(Humanoid Unified and General Whole-Body Controller)是上海交通大学、上海AI Lab联合推出的人形机器人全身控制器,能实现精细的运动控制。HUGWBC基于扩展的命令空间和先进的训练技术,让机器人执行多种自然步态(如行走、跑步、跳跃、站立和单脚跳),支持实时外部上肢控制信号,实现复杂的运动操作任务。HUGWBC用强化学习在模拟环境中训练,用不对称训练框架(AAC)将策略直接迁移到真实机器人上。

HUGWBC

HUGWBC的主要功能

支持多种步态:支持控制机器人执行行走、跑步、跳跃、站立和单脚跳等多种步态。精细调整参数:支持调整步态频率、脚摆高度、身体高度、腰部旋转和身体俯仰角等参数,适应不同的任务需求。实时外部干预:支持上肢的实时外部控制信号(如遥操作或运动重定向),让机器人在执行运动任务时进行复杂的操作。高鲁棒性和适应性:HUGWBC能适应不同的地形和外部干扰,保持运动的稳定性和精度。

HUGWBC的技术原理

扩展的命令空间:设计包含任务命令和行为命令的通用命令空间,灵活地控制机器人的运动和姿态。强化学习训练:基于强化学习(特别是PPO算法)在模拟环境中训练控制策略,定义奖励函数优化机器人的运动性能。不对称训练框架:采用不对称训练框架(AAC),批评网络访问所有特权信息,演员网络仅用真实机器人可用的传感器数据,提高策略的泛化能力。对称性损失:引入对称性损失函数,鼓励策略生成自然且对称的运动,提高运动的稳定性和效率。干预训练:在训练中引入外部干预信号,适应上肢的实时控制,且保持下肢运动的稳定性和精度。脚轨迹规划:用五次多项式轨迹规划方法,确保脚在摆动阶段的平滑运动,提高运动的自然性和稳定性。

HUGWBC的项目地址

项目官网:https://hugwbc.github.io/arXiv技术论文:https://arxiv.org/pdf/2502.03206

HUGWBC的应用场景

复杂地形导航:控制人形机器人在不平坦的地形上行走、跑步和跳跃,适应各种复杂的环境,如崎岖的山路、废墟或建筑工地等,执行搜索和救援任务。动态任务执行:支持机器人进行高动态任务,如快速奔跑、跳跃和单脚跳,在需要快速反应和高机动性的场景中发挥作用,例如体育赛事辅助或紧急响应任务。人机协作任务:基于实时外部上肢干预功能,让人形机器人与人类操作员协作完成复杂的任务,如搬运、装配或精细操作,提高工作效率和安全性。服务机器人应用:在家庭或服务场所中,让人形机器人执行日常任务,如清洁、搬运物品或协助老年人和残疾人,提供更加自然和灵活的服务。科学研究与开发:开发和测试新的运动控制算法、人机交互技术和机器人感知能力,推动人形机器人技术的进一步发展。
上一篇:TPO – AI优化框架,动态调整推理模型的输出,更符合人类偏好
相关资讯 更多+
  • HUGWBC – 上海交大联合上海 AI Lab 推出的人形机器人全身控制器
    HUGWBC – 上海交大联合上海 AI Lab 推出的人形机器人全身控制器

    HUGWBC(Humanoid Unified and General Whole-Body Controller)是上海交通大学、上海AI Lab联合推出的人形机器人全身控制器,能实现精细的运动控制。HUGWBC基于扩展的命令空间和先进的训练技术,让机器人执行多种自然步态(如行走、跑步、跳跃、站立和单脚跳),支持实时外部上肢控制信号,实现复杂的运动操作任务。

    AI教程资讯 2023-04-14

  • TPO – AI优化框架,动态调整推理模型的输出,更符合人类偏好
    TPO – AI优化框架,动态调整推理模型的输出,更符合人类偏好

    TPO(Test-Time Preference Optimization)是新型的AI优化框架,在推理阶段对语言模型输出进行动态优化,更符合人类偏好。TPO通过将奖励信号转化为文本反馈,将模型生成的优质响应标记为“选择”输出,低质量响应标记为“拒绝”输出,进而生成“文本损失”并提出“文本梯度”,以此迭代改进模型输出,无需更新模型参数。

    AI教程资讯 2023-04-14

  • PDF to Podcast – 英伟达推出的 PDF 转音频内容 AI 工具
    PDF to Podcast – 英伟达推出的 PDF 转音频内容 AI 工具

    PDF to Podcast是NVIDIA推出的PDF转音频的AI工具,基于NVIDIA NIM微服务架构的,能将PDF文档转换为生动的音频内容,如播客。基于大型语言模型(LLM)、文本到语音(TTS)技术以及NVIDIA的微服务,将PDF中的内容提取转换为Markdown格式,再生成自然流畅的对话或独白形式的音频。

    AI教程资讯 2023-04-14

  • InternVideo2.5 – 上海 AI Lab 联合南大、中科院开源的视频多模态大模型
    InternVideo2.5 – 上海 AI Lab 联合南大、中科院开源的视频多模态大模型

    InternVideo2 5是上海人工智能实验室联合南京大学、中科院深圳先进技术研究院共同开源的视频多模态大模型。在视频理解领域取得了显著进展,特别是在长视频处理和细粒度时空感知方面表现出色。模型能处理长达万帧的视频,视频处理长度较前代提升了6倍,可在长视频中精准定位目标帧,实现“大海捞针”式的检索。

    AI教程资讯 2023-04-14

最新录入 更多+
确定