HoloDrive是什么
HoloDrive 是商汤和上海人工智能实验室等机构提出的用于自动驾驶的整体2D-3D多模态街道场景生成框架。框架联合生成相机图像和激光雷达点云,填补自动驾驶中2D-3D多模态联合生成的空白。HoloDrive 在异构生成模型之间采用BEV-to-Camera和Camera-to-BEV转换模块,在2D生成模型中引入深度预测分支,消除从图像空间到BEV空间的投影歧义。

来源:爱论文 时间:2025-03-31 14:30:14
HoloDrive 是商汤和上海人工智能实验室等机构提出的用于自动驾驶的整体2D-3D多模态街道场景生成框架。框架联合生成相机图像和激光雷达点云,填补自动驾驶中2D-3D多模态联合生成的空白。HoloDrive 在异构生成模型之间采用BEV-to-Camera和Camera-to-BEV转换模块,在2D生成模型中引入深度预测分支,消除从图像空间到BEV空间的投影歧义。
HoloDrive 是商汤和上海人工智能实验室等机构提出的用于自动驾驶的整体2D-3D多模态街道场景生成框架。框架联合生成相机图像和激光雷达点云,填补自动驾驶中2D-3D多模态联合生成的空白。
AI教程资讯
2023-04-14
Perception-as-Control是阿里巴巴通义实验室推出的图像动画框架,能根据用户意图实现细粒度的运动控制。Perception-as-Control基于构建3D感知运动表示,将相机和物体运动转化为直观、一致的视觉变化,用感知结果作为运动控制信号,支持多种与运动相关的视频合成任务。Perception-as-Control框架基于U-Net架构的扩散模型,结合参考图像的外观信息和运动控制信号的运动信息,生成可控的图像动画。
AI教程资讯
2023-04-14
Motion Dreamer是香港科技大学(广州)研究者提出的视频生成框架,生成运动合理视频。基于两阶段生成方式,先基于输入图像和运动条件生成中间运动表示,再利用该表示生成高细节视频。其引入实例流这一新运动模态,可实现从稀疏到密集的运动控制,用户通过提供稀疏运动提示,模型能生成时间连贯视频。
AI教程资讯
2023-04-14
Sky-T1是加州大学伯克利分校Sky Computing实验室的研究团队NovaSky发布的开源推理AI模型,名为Sky-T1-32B-Preview。是首个开源推理模型,训练数据集和代码均已公开,用户可以从零开始复现该模型。
AI教程资讯
2023-04-14