当前位置: 网站首页 >AI教程资讯 >正文

CAD-MLLM – 上海科技大学联合多机构推出的计算机辅助设计CAD模型生成系统

来源:爱论文 时间:2025-02-05 14:02:08

CAD-MLLM是什么

CAD-MLLM是由上海科技大学、Transcengram、DeepSeek AI和香港大学共同推出的,计算机辅助设计(CAD)模型生成系统,根据用户的多种输入(如文本描述、图像、点云或这些输入的组合)生成参数化的CAD模型。系统用命令序列和大型语言模型(LLMs)对齐和处理多模态数据,构建完整的CAD模型。CAD-MLLM引入一个名为Omni-CAD的大规模多模态数据集,及新的评估指标,全面评估生成模型的拓扑质量和表面封闭程度。CAD-MLLM在性能上超越现有方法,展现出对数据缺陷的高度鲁棒性。

CAD-MLLM

CAD-MLLM的主要功能

多模态输入处理:处理包括文本描述、图像、点云在内的多种输入形式,基于输入生成CAD模型。参数化CAD模型生成:系统能生成参数化的CAD模型,用户能对生成的模型进行编辑和调整。数据集构建与注释:引入名为Omni-CAD的数据集,包含文本描述、多视图图像、点云和对应的CAD命令序列。评估指标创新:系统引入新的评估指标,评估生成的CAD模型的拓扑质量和表面封闭程度。鲁棒性:在处理噪声和缺失数据时表现出高度的鲁棒性。交互式设计:用户基于简单的指令和插图轻松设计CAD模型,让非专家也能实现设计想法。

CAD-MLLM的技术原理

命令序列表示:用CAD模型的命令序列,将命令序列向量化,形成适合大型语言模型(LLMs)学习的数据流。多模态数据对齐:用先进的LLMs对齐不同模态数据和CAD模型的向量表示,让模型理解和处理多种输入。网络架构:网络架构包括视觉数据对齐、点数据对齐和大型语言模型三个模块,支持跨模态输入。特征空间共享:非文本输入首先基于冻结的编码器处理,然后用投影层将特征对齐在共享的大型语言模型(LLM)特征空间内。低秩适应(LoRA)微调:基于整合提示与多模态嵌入,并应用低秩适应(LoRA)技术对LLM进行微调,生成准确的CAD模型。数据增强方法:提出数据注释流程和数据增强方法,生成新的多模态条件CAD数据集Omni-CAD。

CAD-MLLM的项目地址

项目官网:cad-mllm.github.ioarXiv技术论文:https://arxiv.org/pdf/2411.04954

CAD-MLLM的应用场景

工业设计和制造:设计师和工程师快速生成和修改复杂的工业产品CAD模型,加速产品开发流程。建筑和工程:建筑师和结构工程师从现场照片或地形数据生成精确的CAD图纸,提高设计和规划的效率。汽车行业:汽车制造商从概念草图或描述中生成精确的汽车零部件CAD模型,优化设计和制造流程。航空航天:在航空航天领域,从复杂的设计要求和性能参数中生成飞机和航天器的零部件和结构的CAD模型。教育和培训:学生和新手,降低学习曲线,提高教学效果。
上一篇:LaTRO – 基于自我奖励提升LLMs复杂推理能力的框架
相关资讯 更多+
  • CAD-MLLM – 上海科技大学联合多机构推出的计算机辅助设计CAD模型生成系统
    CAD-MLLM – 上海科技大学联合多机构推出的计算机辅助设计CAD模型生成系统

    CAD-MLLM是由上海科技大学、Transcengram、DeepSeek AI和香港大学共同推出的,计算机辅助设计(CAD)模型生成系统,根据用户的多种输入(如文本描述、图像、点云或这些输入的组合)生成参数化的CAD模型。系统用命令序列和大型语言模型(LLMs)对齐和处理多模态数据,构建完整的CAD模型。

    AI教程资讯 2023-04-14

  • LaTRO – 基于自我奖励提升LLMs复杂推理能力的框架
    LaTRO – 基于自我奖励提升LLMs复杂推理能力的框架

    LaTRO(Latent Reasoning Optimization)是先进的框架,提升大型语言模型(LLMs)在复杂推理任务中的表现。基于将推理过程类比为从潜在分布中采样,用变分推断方法进行优化,LaTRO让模型自我改进,增强生成和评估推理路径的能力。

    AI教程资讯 2023-04-14

  • ReCapture – 谷歌和新加坡国立大学共同推出的视频处理技术
    ReCapture – 谷歌和新加坡国立大学共同推出的视频处理技术

    ReCapture是谷歌和新加坡国立大学推出的视频处理技术,能从单一用户提供的视频中生成具有新相机轨迹的新视频。ReCapture用多视图扩散模型或基于深度的点云渲染生成带有新相机轨迹的噪声锚视频,采用掩码视频微调技术,将锚视频转换成干净、时间一致的重新角度化视频,保留原始视频中的场景运动,从新角度展现场景。

    AI教程资讯 2023-04-14

  • MagicClay – Adobe 推出的3D建模工具,文本引导3D模型局部雕刻
    MagicClay – Adobe 推出的3D建模工具,文本引导3D模型局部雕刻

    MagicClay 是 Adobe 推出3D建模工具,结合网格和有向距离场(SDF)技术,支持艺术家基于文本提示对3D模型的特定部分进行雕刻,同时保持模型的其他区域不变。MagicClay 支持生成具有纹理的三维模型,能非破坏性地编辑局部网格,让艺术家用文本提示为基础,对3D模型进行更直观和更精细的编辑。

    AI教程资讯 2023-04-14

最新录入 更多+
确定