长久以来,AI 生成 3D 内容的主流范式是输出离散的点云、网格或体素。这些 “哑” 模型虽然能捕捉形状,却丢失了设计意图和工程可编辑性,设计师拿到后往往需要从头重建。Spectral Labs 于 2025 年 9 月发布的 SGS-1,打破了这一僵局,成为业界首个能直接生成结构化、参数化 CAD 模型的生成式 AI。它不生产静态的 “图片”,而是输出包含精确几何关系和可调参数的 STEP 文件,让 AI 真正迈入了工程设计的核心领域。
SGS-1 的核心创新在于其输出目标。与 DeepCAD、SkexGen 等前辈模型不同,后者虽然也尝试生成 CAD 操作序列,但其本质仍是将 CAD 指令视为一种 “语言” 进行序列建模,最终产物是供程序解析的代码或命令流。而 SGS-1 则更进一步,它直接瞄准了 CAD 系统的 “内核”—— 边界表示(B-Rep)。B-Rep 是现代 CAD 软件(如 SolidWorks, Fusion 360)用于精确描述实体几何的工业标准,它由面、边、顶点及其拓扑连接关系构成,是参数化、可编辑设计的基石。SGS-1 能够根据一张图片或一个 3D 网格,直接推理并生成符合 B-Rep 标准的 STEP 文件。这意味着,设计师拿到 SGS-1 的输出后,无需任何转换或逆向工程,即可在熟悉的 CAD 环境中直接打开、测量、修改尺寸、添加特征,无缝融入现有的设计工作流。
这一能力的工程价值是颠覆性的。在官方演示中,SGS-1 被要求为一个滚轮组件设计一个安装支架。它不仅能根据上下文理解支架需要匹配的孔位和轮廓,更能生成一个包含精确参数的模型。设计师导入后,只需简单地将支架的宽度参数从 10mm 调整为 12mm,整个模型的几何关系便自动更新,完美适配新的装配要求。相比之下,即使是 GPT-5 这样的顶级多模态推理模型,在执行相同任务时,也因缺乏真正的空间智能,生成的几何体要么过于简化,要么特征错位,完全无法在装配体中使用,设计师不得不放弃 AI 输出,从零开始。
SGS-1 的实用性体现在多个场景。首先是 “草图到模型” 的自动化。设计师手绘的草图或扫描的工程图纸,可以直接输入 SGS-1,转化为精确的 3D 参数化模型,极大地加速了概念设计阶段。其次是 “逆向工程” 的智能化。面对一个仅有 STL 网格文件的老旧零件或扫描件,SGS-1 能自动将其 “理解” 并重构为包含参数的 STEP 文件,省去了工程师手动逆向建模的繁琐过程。最令人兴奋的是 “上下文感知设计”。SGS-1 可以读取一个不完整的装配体,结合文本描述(如 “在此处添加一个带加强筋的 L 型支架”),直接生成一个在几何和功能上都与现有组件匹配的新零件,这为 AI 辅助的协同设计打开了大门。
当然,SGS-1 并非万能。其当前版本明确存在三大限制:首先,它专为工程设计优化,对高度有机、曲面复杂的创意资产(如角色模型、雕塑)表现不佳。其次,模型的 3D 分辨率有限,难以生成非常精细或极薄的结构。最后,它目前无法一次性生成包含多个零件和装配关系的完整装配体,只能逐个生成零件。这些限制清晰地勾勒出了 SGS-1 的定位:它不是一个通用的 3D 内容生成器,而是一个专注于解决工业设计痛点的 “工程专家”。
从技术路线上看,SGS-1 的成功也暗示了未来 AI-CAD 融合的方向。与其让大语言模型(LLM)通过编写代码来 “描述” 几何(这本质上是间接的、易出错的),不如让模型直接学习几何本身的内在结构和约束。这需要模型具备强大的空间推理能力,能够理解点、线、面之间的拓扑关系和几何约束(如平行、垂直、相切)。SGS-1 的非 Transformer 架构(根据输入提示)可能正是为了更好地捕捉这种空间关系而设计的,这与处理序列化文本的 Transformer 有着根本的不同。
总而言之,SGS-1 的发布标志着生成式 AI 在物理世界设计领域的一个重要里程碑。它不再满足于 “像” 一个设计,而是真正 “是” 一个设计。它将 AI 从辅助工具的角色,提升为能够理解并产生物理世界 “语言” 的合作伙伴。对于工程师和设计师而言,这意味着一个新时代的开始:他们可以将更多精力投入到创造性的问题解决和系统级优化上,而将重复性的几何建模工作交给 AI。随着下一代模型在多模态支持、复杂空间上下文理解和物理仿真反馈强化学习上的突破,我们有理由期待,AI 将不仅仅是设计的助手,更可能成为工程创新的核心驱动力。