Hotdry.
ai-systems

剖析Transformer架构如何工程化解构CAD生成:参数化、拓扑一致性与几何约束

深入解析SGS-1等前沿模型如何将Transformer应用于CAD序列生成,通过参数量化、拓扑-几何解耦与分步扩散策略,解决结构化数据生成中的工程挑战。

在人工智能驱动设计的浪潮中,Spectral Labs 于 2025 年 9 月发布的 SGS-1 模型,标志着生成式 AI 正式叩开结构化工程设计的大门。与生成离散点云或网格的传统 3D 模型不同,SGS-1 的核心使命是输出可直接导入 CAD 软件、具备完整设计意图与可编辑性的结构化操作序列。这一跃迁的本质,是将 Transformer 架构从处理自然语言的 “语义序列”,成功迁移至处理工程设计的 “几何 - 拓扑序列”。其背后并非简单的架构平移,而是一系列针对 CAD 领域特有挑战 —— 几何约束的精确性、拓扑结构的一致性、参数的混合离散连续性 —— 所进行的精妙工程化解构。

首要挑战在于 CAD 数据的 “非自然” 结构。一个有效的 CAD 模型并非无序的几何堆砌,而是一系列严格遵循几何关系(如平行、垂直、相切)和拓扑规则(如边必须连接两个顶点,面必须由闭合环界定)的操作指令。DeepCAD 等先驱工作揭示了关键洞见:将每个 CAD 操作(如 “画一条从点 A 到点 B 的直线” 或 “将草图沿 Z 轴拉伸 10mm”)视为一个 “词汇”,整个建模过程则构成一个语法严谨的 “句子”。Transformer 凭借其强大的序列建模与长距离依赖捕捉能力,成为处理此类序列的理想选择。然而,直接套用标准 Transformer 会遭遇 “参数鸿沟”——CAD 命令参数是离散(如命令类型 “直线”、“圆弧”)与连续(如坐标、角度、长度)的混合体,而标准 Transformer 更擅长处理离散的词嵌入。工程化解法是 “参数正则化与量化”。如 DeepCAD 模型所示,所有连续参数(坐标、尺寸)被归一化到固定范围(如 2x2x2 立方体),再量化为 256 级离散值,用 8 位整数表示。这不仅统一了输入格式,更关键的是,它将连续值的回归问题转化为离散值的分类问题,极大提升了模型对精确几何关系(如确保两条线严格垂直)的学习能力,避免了因微小回归误差导致的结构失效。

更深层的挑战是几何与拓扑的强耦合。在 B-rep(边界表示)等主流 CAD 内核中,几何(点的位置、曲线的形状)与拓扑(点、边、面的连接关系)相互依存,牵一发而动全身。传统方法往往重几何轻拓扑,导致生成的模型虽 “形似” 却 “神散”,出现悬空的边或破洞的面。DTGBrepGen 模型提出的 “拓扑 - 几何解耦” 框架为此提供了优雅的解决方案。其核心思想是分阶段、分治处理:第一阶段,模型专注于生成一个纯粹的、有效的拓扑骨架。这通常通过建模 “边 - 面” 和 “边 - 顶点” 的邻接关系来实现,确保生成的图结构在数学上是完备且一致的,例如,每条边必须恰好属于两个面,每个顶点必须有合理的度数。第二阶段,在已确立的、稳固的拓扑骨架之上,再利用基于 Transformer 的扩散模型,按顺序生成几何细节:先生成所有顶点的精确 3D 坐标,再生成边的几何形状(如直线、B 样条曲线),最后生成面的几何定义(如平面、NURBS 曲面)。这种 “先骨架,后血肉” 的策略,从根本上保证了模型的结构有效性,即使几何生成出现微小偏差,也不会破坏整体的拓扑完整性。

对于 SGS-1 这类面向实际工程应用的模型,其架构设计必然内嵌了对 “设计意图” 和 “可编辑性” 的考量。这超越了单纯的序列生成,指向了更高阶的控制能力。SkexGen 模型提出的 “解耦码本”(Disentangled Codebooks)概念极具启发性。它利用不同的 Transformer 编码器,将输入序列的变异信息分别编码到独立的 “拓扑码本”、“几何码本” 和 “拉伸码本” 中。用户或下游系统可以通过操控这些独立的码本向量,实现对生成结果的精准干预 —— 例如,保持拓扑结构不变,仅修改几何尺寸以探索不同比例的设计;或保持几何形状不变,仅调整拉伸方向以测试不同装配方案。这种解耦不仅提升了生成的多样性与质量,更重要的是赋予了 AI 生成结果以 “工程可控性”,使其从一个黑盒玩具转变为设计师手中强大的辅助工具。

综上所述,SGS-1 所代表的 Transformer for CAD 范式,其成功并非源于架构本身的颠覆性创新,而在于对领域知识的深刻理解与工程化封装。通过将 CAD 操作序列化、参数离散化、拓扑几何解耦化,Transformer 得以在结构化数据的复杂约束下稳健运行。展望未来,这一领域的演进将聚焦于两大方向:一是处理更复杂的操作原语(如布尔运算、圆角、倒角),将当前以 “草图 - 拉伸” 为主的简化模型扩展至全功能 CAD 操作集;二是强化 “设计意图对齐”,如最新研究尝试将大型语言模型(LLM)的推理能力引入,用于生成符合工程规范和设计习惯的约束关系。SGS-1 的发布,不仅是一个模型的诞生,更是为 AI 深度融入物理世界的设计与制造流程,铺设了一条坚实可行的技术路径。

查看归档