SGS-1 如何用 GNN+扩散模型实现参数化 CAD 几何约束求解
解析 Spectral Labs SGS-1 的核心技术选型:以 GNN 编码拓扑、扩散模型学习约束分布,结合物理信息引导,构建可落地的参数化几何约束求解器。
在计算机辅助设计(CAD)领域,几何约束求解长期依赖符号计算与数值迭代,面对复杂装配体或参数化变更时效率低下且易发散。Spectral Labs 发布的 SGS-1 模型,首次将图神经网络(GNN)与扩散模型结合,构建出面向结构化 CAD 的生成式约束求解器,其核心价值不在于“生成新设计”,而在于“高效求解参数变更后的几何一致性”。本文将拆解其技术路径,并给出可工程化的参数配置与监控清单。
首先,SGS-1 的架构基石是 GNN 对 CAD 图元关系的编码能力。传统 Transformer 因缺乏显式空间归纳偏置,难以高效建模点、线、面之间的邻接与层级约束。SGS-1 采用类似 Ψ-GNN 的消息传递机制,将每个几何图元(如草图中的线段或特征中的拉伸面)视为图节点,其空间坐标、法向量、约束类型(平行、垂直、相切等)作为节点特征;图元间的约束关系则作为边,边权可动态学习。这种结构使模型天然理解“若 A 与 B 平行,则其法向量点积应为零”的局部规则,避免了 Transformer 在长序列中稀释空间语义的问题。实际部署时,建议将最大邻接半径设为 3–5 层,既能覆盖常见装配约束,又避免图爆炸;节点特征维度推荐 128–256,以平衡表达力与推理速度。
其次,扩散模型的作用并非直接生成几何,而是学习“满足约束的隐空间分布”。SGS-1 的创新点在于,它不将原始 CAD 坐标作为扩散目标,而是先通过 GNN 编码器将其映射到低维隐向量 z,再在 z 空间执行扩散过程。这一设计借鉴了 VQ-CAD 的思路——在隐空间中,几何约束可被松弛为向量间的内积或距离约束,从而绕过显式求解非线性方程组。例如,“两圆相切”在隐空间中可能对应“z₁ 与 z₂ 的 L2 距离小于阈值 δ”。扩散模型通过反向去噪,从随机噪声逐步逼近满足所有隐约束的 z*,再由 GNN 解码器映射回实际几何。关键参数是扩散步数 T 与噪声调度:T=50–100 可在精度与速度间取得平衡;噪声方差应随 t 递减,初期大噪声探索全局解空间,后期小噪声微调局部一致性。
为确保生成结果严格满足工程约束,SGS-1 引入物理信息引导机制。这里可借鉴“Training-Free Constrained Generation with Stable Diffusion Models”中的思想:在扩散采样过程中,每步去噪后计算当前 z_t 与所有约束条件的残差(如距离误差、角度偏差),并沿残差梯度方向微调 z_t,类似投影梯度法。更高效的做法是采用 DSG(Diffusion with Spherical Gaussian Constraint)的闭式解——将约束视为高维球面上的置信区间,引导步长自适应缩放,既避免远离流形,又允许大步长加速收敛。工程实践中,建议设置残差容忍度 ε=1e-4 mm(长度)或 1e-3 rad(角度),超出则触发回滚至上一稳定状态;同时监控每步的平均残差下降率,若连续 5 步下降率低于 5%,则判定为局部最优,需注入额外噪声重启搜索。
最后,系统级设计需关注失败兜底与人机协同。SGS-1 并非万能求解器,当约束系统过约束或存在拓扑冲突时,模型可能输出无效解。此时应配置“约束冲突检测器”:在 GNN 编码阶段,若某节点的入度约束数 > 3(3D 空间自由度上限),则标记为潜在冲突,交由传统求解器处理或提示用户简化约束。同时,提供“参数敏感度热力图”——通过扰动隐空间 z 并观察输出几何变化,量化各设计参数对最终解的影响,辅助工程师决策。例如,若某孔位坐标对“同心”约束的敏感度高达 0.8,说明该约束主导了解空间,微调孔径可能比移动孔位更易收敛。
综上,SGS-1 通过 GNN+扩散的架构,将几何约束求解从“方程迭代”转化为“隐空间采样+物理引导”,其工程价值在于参数化设计场景下的快速重解算。落地时,聚焦三大模块:GNN 编码器的邻接半径与特征维度、扩散过程的步数与噪声调度、物理引导的残差阈值与回滚策略。监控指标应包含“单次求解耗时”、“约束满足率”、“冲突检测触发率”,形成闭环优化。这不仅是模型架构的胜利,更是将生成式 AI 从“创意发散”拉回“工程收敛”的关键一步。