当前位置: 网站首页 >AI教程资讯 >正文

LaDeCo – 西安交大联合微软推出的自动图形设计构图方法

来源:爱论文 时间:2025-01-16 13:29:05

LaDeCo是什么

LaDeCo是西安交通大学和微软研究院联合推出的自动图形设计构图方法,基于将设计任务分解为层次化的步骤来实现。LaDeCo对输入的设计元素进行层规划,将它们分配到不同的语义层,比如背景、底层、图像/标志、文本和装饰。然后,LaDeCo逐层预测,生成每个设计层的元素属性,将之前生成层的渲染图像作为上下文信息,指导后续层的生成。LaDeCo基于大型多模态模型(LMMs)处理多模态输入,支持无需特定任务训练的设计子任务,如分辨率调整、元素填充和设计变化。

LaDeCo

LaDeCo的主要功能

层规划:自动将输入的多模态设计元素(如图像、文本)分配到不同的语义层,例如背景、底层、图像/标志、文本和装饰层。层级设计生成:基于层规划的结果,逐步预测和生成每个层的元素属性,创建完整的设计构图。分辨率调整:根据不同的画布尺寸调整设计,让设计在不同大小的画布上都具有吸引力。元素填充:在现有设计中添加新的元素,增强设计的吸引力。设计变化:给定相同的输入元素,创造出多种不同的设计,为用户提供多种选择。

LaDeCo的技术原理

大型多模态模型(LMMs):基于大型多模态模型,理解多模态上下文,生成跨领域响应。层规划模块:基于预训练的LMMs(例如GPT-4o)预测输入元素的语义标签,实现元素到设计层的自动分类。层级生成过程:根据层规划的结果,逐层生成设计元素的属性,将已生成层的渲染图像作为上下文信息反馈给模型,指导后续层的生成。视觉编码器和投影器:用在编码元素图像和中间设计,生成图像嵌入,并将投影以匹配LMMs主干所需的隐藏状态维度。链式思考(Chain-of-Thought)推理:LaDeCo的层级生成方法体现了链式思考推理的理念,基于逐步生成和调整设计层提高推理性能。

LaDeCo的项目地址

项目官网:elements2design.github.ioarXiv技术论文:https://arxiv.org/pdf/2412.19712

LaDeCo的应用场景

设计师:帮助设计师自动完成图形设计构图任务,提升设计效率和质量。研究人员和规划人员:在景观变化研究、美学评估和视觉影响评估中,让研究人员和规划人员快速、客观地计算图像中视觉元素的比例,简化评估过程。评估人员:评估视觉景观元素具有重要作用,帮助评估人员进行更高效的视觉元素分析。开发者:对于开发者来说,基于LaDeCo开发不同的应用。泛年轻人群:LaDeCo在自动图形设计领域的应用吸能19-35岁的人群对创意内容、分享、音乐、短视频、游戏、时尚等有较高偏好的人群。
上一篇:SEMIKONG – 专为半导体领域设计的大型语言模型
相关资讯 更多+
  • LaDeCo – 西安交大联合微软推出的自动图形设计构图方法
    LaDeCo – 西安交大联合微软推出的自动图形设计构图方法

    LaDeCo是西安交通大学和微软研究院联合推出的自动图形设计构图方法,基于将设计任务分解为层次化的步骤来实现。LaDeCo对输入的设计元素进行层规划,将它们分配到不同的语义层,比如背景、底层、图像 标志、文本和装饰。

    AI教程资讯 2023-04-14

  • SEMIKONG – 专为半导体领域设计的大型语言模型
    SEMIKONG – 专为半导体领域设计的大型语言模型

    SEMIKONG是专门为半导体行业定制的大型语言模型(LLM),是Aitomatic、FPT Software和东京电子有限公司联合推出的。基于深入的领域知识,解决半导体制造和设计中的独特挑战,如复杂的物理和化学问题。

    AI教程资讯 2023-04-14

  • MinT – 生成顺序事件的文本转视频模型,灵活控制时间戳
    MinT – 生成顺序事件的文本转视频模型,灵活控制时间戳

    MinT(Mind the Time)是Snap Research、多伦多大学和向量研究所联合推出的多事件视频生成框架,基于精确的时间控制,根据文本提示生成包含多个事件的视频序列。MinT的核心技术是时间基位置编码(ReRoPE),让模型能将特定的文本提示与视频中的相应时间段关联起来,确保事件按顺序发生,控制每个事件的持续时间。

    AI教程资讯 2023-04-14

  • Wonderland – 多伦多大学、Snap和UCLA联合推出的单视图3D场景生成技术
    Wonderland – 多伦多大学、Snap和UCLA联合推出的单视图3D场景生成技术

    Wonderland是多伦多大学、Snap和UCLA的研究团队推出的技术,能够从单张图像生成高质量、广范围的3D场景,允许控制摄像轨迹。证明了三维重建模型可以有效地建立在扩散模型的潜在空间上,实现高效的三维场景生成,是单视图3D场景生成领域的一次突破性进展。

    AI教程资讯 2023-04-14

最新录入 更多+
确定