HiCo是什么
HiCo是360 AI研究院推出的基于扩散模型的层次化可控布局到图像生成模型,HiCo基于多分支结构设计,实现对对象位置和文本描述的精确控制。HiCo的关键特点在于进行空间解耦,有效地处理复杂布局,减少对象缺失和视角冲突等问题。HiCo在自然场景的多目标可控布局生成中表现出色,引入HiCo-7K基准测试集。HiCo模型展示了与快速生成插件(如LoRA、LCM)的兼容性,能生成高分辨率图像,在处理多概念组合布局时仍有改进空间。

来源:爱论文 时间:2025-02-11 17:10:43
HiCo是360 AI研究院推出的基于扩散模型的层次化可控布局到图像生成模型,HiCo基于多分支结构设计,实现对对象位置和文本描述的精确控制。HiCo的关键特点在于进行空间解耦,有效地处理复杂布局,减少对象缺失和视角冲突等问题。HiCo在自然场景的多目标可控布局生成中表现出色,引入HiCo-7K基准测试集。HiCo模型展示了与快速生成插件(如LoRA、LCM)的兼容性,能生成高分辨率图像,在处理多概念组合布局时仍有改进空间。
HiCo是360 AI研究院推出的基于扩散模型的层次化可控布局到图像生成模型,HiCo基于多分支结构设计,实现对对象位置和文本描述的精确控制。HiCo的关键特点在于进行空间解耦,有效地处理复杂布局,减少对象缺失和视角冲突等问题。
AI教程资讯
2023-04-14
Ferret-UI 2是苹果公司推出的多模态大型语言模型,用在理解和交互移动用户界面。Ferret-UI 2能识别和理解各种移动设备屏幕上的UI元素,执行复杂的用户指令,实时观察用户在移动设备屏幕上的操作,随时准备提供帮助和执行任务。
AI教程资讯
2023-04-14
MMBench-Video是新颖的长视频多题问答基准测试,是浙江大学、上海人工智能实验室、上海交通大学和香港中文大学联合推出的。MMBench-Video能全面评估大型视觉语言模型(LVLMs)在视频理解方面的能力,用包含丰富视频内容和细粒度能力评估的长视频,弥补现有基准测试在时序理解和复杂任务处理方面的不足。
AI教程资讯
2023-04-14
MiniMates是高性能的轻量级数字人驱动算法,具备语音和表情两种驱动模式,能在普通电脑上实现实时运行。基于先进的技术架构,提供极致的速度体验和个性化定制功能,支持用户根据、需求定制AI伙伴。MiniMates拥有卓越的性能和灵活性,为用户提供强大的数字人驱动解决方案,适用于多种应用场景。
AI教程资讯
2023-04-14