LLaMA-Mesh是清华大学和NVIDIA共同推出的项目,基于将3D网格生成与大型语言模型(LLMs)结合,实现用文本提示直接生成3D模型的功能。项目用OBJ文件格式将3D网格的顶点坐标和面定义转换为文本,基于顶点量化技术优化处理,让模型能理解和生成3D网格。
AI教程资讯
2025-02-06
iAgents是清华大学推出的多AI智能体协作框架,基于为每个用户配备个人AI智能体促进协作和完成日常任务。智能体能理解用户的文件、命令,从协作中学习,实现自动的信息交换和任务解决。iAgents用infoNav推理机制指导智能体在信息不对称的情况下进行有效沟通,提高团队协作效率并推动AI技术的前沿发展。
AI教程资讯
2025-02-06
DanceFusion是清华大学推出的开源框架,专注于音频驱动的舞蹈动作重建与生成。DanceFusion结合分层时空Transformer-VAE和扩散模型,能处理社交媒体上的不完整和嘈杂骨骼数据,生成与音乐同步的逼真舞蹈动作。DanceFusion技术基于先进的掩码策略和迭代扩散过程,优化动作序列,确保动作生成的高保真度和音乐同步性,广泛应用于内容创作、虚拟现实和互动娱乐等领域。
AI教程资讯
2025-02-06
Symphony Creative Studio是TikTok推出的AI视频创作工具,帮助广告主和内容创作者简化视频制作流程。Symphony Creative Studio集成视频生成、转换和扩展功能,用户输入信息和素材或导入URL后,系统结合授权资源自动生成视频。Symphony Creative Studio支持AI虚拟人物视频创作,视频翻译配音,及基于品牌IP创建定制虚拟形象。
AI教程资讯
2025-02-06