Antigravity 2.0 登顶 OpenSCAD 建筑生成基准：从目测到参数驱动的架构跃迁

在 ModelRift 近期发布的 OpenSCAD 建筑 3D 生成基准测试中，Google Antigravity 2.0 以 4.5/5 的质量评分登顶，成为六款参测工具中自主生成能力最强的方案。这一结果不仅验证了 Gemini 3.5 Flash High 在空间代码生成上的潜力，更揭示了从 "目测参考图" 到 "参数驱动建模" 的范式转变对 3D CAD 生成质量的决定性影响。

OpenSCAD：LLM 友好的几何表达媒介

OpenSCAD 作为纯文本化的 CAD 工具，其语法结构天然适合语言模型处理。与需要操作 UI 的 Blender MCP 方案不同，OpenSCAD 允许模型直接以代码描述几何关系 ——"在半径 R 处重复 28 根圆柱" 或 "从穹顶减去 Oculus 开口"。这种声明式表达将空间意图转化为可版本控制、可 diff 对比的文本 artifact，大幅降低了 LLM 的推理负担。

该基准选择罗马万神殿作为测试任务，正是看中其几何特征的复杂性：径向对称的圆形鼓座、球面穹顶、中央天眼、矩形门廊与三角山花 —— 这些元素恰好落在 OpenSCAD 擅长的布尔运算、旋转挤出与参数化循环的舒适区内，同时又具备足够的建筑辨识度来区分优劣输出。

Antigravity 2.0 的差异化策略

Antigravity 2.0 的核心突破在于它没有仅依赖参考图像的目测推理，而是在规划阶段主动搜索了万神殿的真实建筑参数。生成的 OpenSCAD 代码中明确包含了鼓座直径、穹顶半径、门廊进深等实测数据，并转化为可调的参数变量。这种 "知识增强" 策略使得最终模型的比例关系显著优于仅凭视觉猜测的竞品。

更具技术含金量的是其对内部细节的还原。Antigravity 2.0 是唯一实现穹顶内部凹格天花板（coffered ceiling）的自主代理——5 层共 28 个方格的几何减法运算。这一细节在参考图像中几乎不可见，需要模型具备建筑史知识并主动决定在代码中实现 show_cutaway 剖面模式来展示内部结构。这种 "超越提示" 的主动规划能力，体现了 Gemini 3.5 Flash High 在复杂任务分解上的优势。

架构设计：Agent-First 与模块化编排

Antigravity 2.0 从 1.0 的 VS Code 插件形态转型为 Agent-First 桌面应用，其架构设计遵循模块化原则：

Skills 层：按需加载的专项能力模块，OpenSCAD 生成即为一项 skill
Rules 层：跨任务保持一致行为的约束规则集
Planning-Execution Loop：规划 → 代码生成 → CLI 渲染预览 → 评估修订的迭代闭环

这种架构使得模型能够在约 12 分钟的运行时间内完成多轮迭代。每轮迭代调用 OpenSCAD CLI 生成 PNG 预览，代理基于视觉反馈调整几何参数，直至满足内部质量阈值。相比之下，Cursor Composer 虽完成速度最快，但缺乏这种深度迭代机制，最终质量评分仅为 1.4/5。

几何后处理与导出验证

基准测试暴露了一个关键工程要点：预览正确性不等于导出正确性。Codex 5.5 High 在迭代过程中的 PNG 预览表现优异，但最终导出的 STL 文件在门廊屋顶与穹顶交界处出现了非流形面（non-manifold facets），导致评分被大幅拉低。

Antigravity 2.0 虽未在公开结果中暴露类似问题，但这一教训对生产环境至关重要。建议的导出后处理流程包括：

Mesh 验证：使用 admesh 或 MeshLab 检测非流形边
布尔运算简化：避免过于细碎的接触面，保持几何体间的 clean boolean
分层导出测试：复杂模型分部件导出验证，再合并为最终 STL

速度 - 质量的权衡与选型建议

Antigravity 2.0 的速度评分仅为 1/5（约 12 分钟），与 Cursor 的极快响应形成鲜明对比。这一权衡反映了当前 LLM CAD 生成的基本规律：高质量建筑模型需要更长的规划与迭代周期。

对于实际工程选型，建议根据场景需求匹配工具：

快速原型：Cursor 等轻量方案适合概念验证阶段
高质量交付：Antigravity 2.0 或 Claude Sonnet 适合需要精确比例与细节的最终输出
人机协作：ModelRift 的 Annotation Mode 允许用户在渲染图上直接标注修改意见，结合 Gemini Flash 3.0 可达到 3.8/5 质量且具备可控性

局限与后续方向

Antigravity 2.0 的当前实现仍存在局限。除速度较慢外，其依赖的 Gemini 3.5 Flash High 的 API 成本较上一代 Flash 提升 3 倍（输入 $1.50/1M tokens，输出 $9.00/1M tokens），在大规模生成场景下需考虑成本优化。此外，复杂模型的 STL 导出稳定性仍需额外验证环节保障。

从更宏观的视角看，OpenSCAD 基准的成功验证了文本化几何表达 + 迭代预览修订这一技术路线的可行性。未来随着多模态模型对空间关系的理解加深，结合参数化约束求解器的混合架构可能成为 3D 生成领域的新范式。

参考来源

ModelRift: "OpenSCAD LLM Benchmark: Building the Pantheon" (2026)
Hacker News 讨论: "Antigravity 2.0 Tops the OpenSCAD Architectural 3D LLM Benchmark"

ai-systems

内容声明：本文无广告投放、无付费植入。

如有事实性问题，欢迎发送勘误至 i@hotdrydog.com。