SGS-1:用 GNN+扩散模型替代 Transformer,实现参数化 CAD 的精确几何约束求解
解析 SGS-1 如何通过图神经网络与扩散模型协同,在无 Transformer 架构下实现参数化 CAD 的精确几何约束求解与工程化落地。
在生成式 AI 席卷设计领域的当下,绝大多数 CAD 生成模型仍依赖 Transformer 架构处理序列化建模指令。然而,Spectral Labs 于 2025 年 9 月发布的 SGS-1 模型,却选择了一条截然不同的技术路径:完全摒弃 Transformer,转而采用图神经网络(GNN)与扩散模型(Diffusion Model)的协同架构,专为解决参数化 CAD 中的精确几何约束求解问题而生。这一架构选择并非标新立异,而是直指工程设计的本质——几何实体及其约束关系天然构成一张图,GNN 正是处理此类关系数据的最优解。本文将深入解析 SGS-1 的核心技术逻辑,并提供可直接落地的工程参数与实施清单。
SGS-1 的首要创新在于其对 CAD 模型的图结构化编码。传统方法将 CAD 命令序列视为一维文本,交由 Transformer 处理,这导致模型难以显式理解“两个面必须平行”或“孔的中心必须位于某条轴线上”这类空间关系。SGS-1 则将每一个几何实体(点、线、面、体)视为图中的一个节点,将它们之间的几何约束(平行、垂直、同心、距离、角度等)视为边。这种编码方式直接映射了工程师的思维模型。更重要的是,SGS-1 的 GNN 层采用了等变(Equivariant)设计,确保当输入的几何坐标发生旋转或平移时,节点间的相对关系保持不变,从而在消息传递过程中天然保持几何一致性。这一点在固定骨架蛋白质设计的研究中已被证实能显著提升结构恢复率,SGS-1 将其成功迁移到了机械 CAD 领域。
在完成图结构编码后,SGS-1 的扩散模型承担了“在约束条件下生成合理几何”的核心任务。这里的扩散过程并非作用于像素或体素,而是直接作用于由 GNN 编码得到的图节点特征和边约束向量。关键在于,几何约束不是在生成后进行后处理校验,而是在扩散的每一步都作为条件注入。具体而言,SGS-1 在扩散模型的 UNet 架构中,将约束条件通过交叉注意力(Cross-Attention)机制嵌入到每一层。例如,当模型在“去噪”过程中试图移动一个孔的位置时,与该孔相关的“同心”约束会通过注意力权重施加拉力,将其拉回正确的轴线上。这种方法与“在潜在空间采样阶段引入可微分美学规则验证器”的思路异曲同工,但 SGS-1 将其应用于硬性的工程约束,确保了生成结果的物理可行性。VQ-CAD 等模型也证明,通过放弃传统数据增强并让模型自行学习隐式约束,能获得更符合工程直觉的设计。
要将这一架构成功工程化,以下几个关键参数和实施步骤至关重要。首先,在 GNN 编码阶段,建议采用 3–5 层的消息传递,每层使用多头注意力机制(参考 Transformer 的成功经验,但作用于图结构),并确保物理坐标被显式加入到消息传递和更新步骤中,以增强等变性。其次,在扩散模型部分,噪声调度器(Noise Scheduler)推荐使用线性调度(beta_start=0.0001, beta_end=0.02),总步数设为 1000,这是在 3D 形状生成中被广泛验证的稳定配置。最关键的是约束注入层的设计:必须为每一种几何约束类型(如距离、角度、平行度)预定义一个可学习的嵌入向量,并在交叉注意力层中将其与对应的图边特征进行融合。最后,监控指标应聚焦于“约束违反率”和“生成收敛步数”,而非单纯的生成质量分数,这是评估模型是否真正理解并遵守工程规则的黄金标准。
尽管 SGS-1 的架构极具前瞻性,但其落地仍面临挑战。最大的风险在于,复杂的几何约束可能导致扩散过程难以收敛,或陷入局部最优解,生成出理论上满足所有约束但实际无法制造的奇异结构。为此,建议在训练初期引入“负样本数据”,即故意违反某些约束的设计,让模型学会识别并拒绝它们。其次,当前架构对大规模装配体(包含成百上千个零件)的处理效率尚不明确,可能需要引入层次化图编码或分块扩散策略。总而言之,SGS-1 通过 GNN+扩散的架构,为参数化 CAD 的生成提供了一种更符合几何本质的解决方案。它不是对现有 Transformer 范式的简单替代,而是开辟了一条通往“空间智能”的新路径,其核心价值在于将工程约束从外部规则内化为模型的生成本能。对于希望在 AI 时代保持设计主权的工程师而言,理解并掌握这一架构,将是构建下一代智能设计系统的关键。