Hotdry.

Article

Antigravity 2.0 登顶 OpenSCAD 建筑生成基准:从目测到参数驱动的架构跃迁

解析 Antigravity 2.0 在万神殿 3D 生成任务中质量分 4.5/5 的技术实现:模块化 agent 架构、真实参数搜索策略与几何后处理优化要点。

2026-05-23ai-systems

在 ModelRift 近期发布的 OpenSCAD 建筑 3D 生成基准测试中,Google Antigravity 2.0 以 4.5/5 的质量评分登顶,成为六款参测工具中自主生成能力最强的方案。这一结果不仅验证了 Gemini 3.5 Flash High 在空间代码生成上的潜力,更揭示了从 "目测参考图" 到 "参数驱动建模" 的范式转变对 3D CAD 生成质量的决定性影响。

OpenSCAD:LLM 友好的几何表达媒介

OpenSCAD 作为纯文本化的 CAD 工具,其语法结构天然适合语言模型处理。与需要操作 UI 的 Blender MCP 方案不同,OpenSCAD 允许模型直接以代码描述几何关系 ——"在半径 R 处重复 28 根圆柱" 或 "从穹顶减去 Oculus 开口"。这种声明式表达将空间意图转化为可版本控制、可 diff 对比的文本 artifact,大幅降低了 LLM 的推理负担。

该基准选择罗马万神殿作为测试任务,正是看中其几何特征的复杂性:径向对称的圆形鼓座、球面穹顶、中央天眼、矩形门廊与三角山花 —— 这些元素恰好落在 OpenSCAD 擅长的布尔运算、旋转挤出与参数化循环的舒适区内,同时又具备足够的建筑辨识度来区分优劣输出。

Antigravity 2.0 的差异化策略

Antigravity 2.0 的核心突破在于它没有仅依赖参考图像的目测推理,而是在规划阶段主动搜索了万神殿的真实建筑参数。生成的 OpenSCAD 代码中明确包含了鼓座直径、穹顶半径、门廊进深等实测数据,并转化为可调的参数变量。这种 "知识增强" 策略使得最终模型的比例关系显著优于仅凭视觉猜测的竞品。

更具技术含金量的是其对内部细节的还原。Antigravity 2.0 是唯一实现穹顶内部凹格天花板(coffered ceiling)的自主代理——5 层共 28 个方格的几何减法运算。这一细节在参考图像中几乎不可见,需要模型具备建筑史知识并主动决定在代码中实现 show_cutaway 剖面模式来展示内部结构。这种 "超越提示" 的主动规划能力,体现了 Gemini 3.5 Flash High 在复杂任务分解上的优势。

架构设计:Agent-First 与模块化编排

Antigravity 2.0 从 1.0 的 VS Code 插件形态转型为 Agent-First 桌面应用,其架构设计遵循模块化原则:

  • Skills 层:按需加载的专项能力模块,OpenSCAD 生成即为一项 skill
  • Rules 层:跨任务保持一致行为的约束规则集
  • Planning-Execution Loop:规划 → 代码生成 → CLI 渲染预览 → 评估修订的迭代闭环

这种架构使得模型能够在约 12 分钟的运行时间内完成多轮迭代。每轮迭代调用 OpenSCAD CLI 生成 PNG 预览,代理基于视觉反馈调整几何参数,直至满足内部质量阈值。相比之下,Cursor Composer 虽完成速度最快,但缺乏这种深度迭代机制,最终质量评分仅为 1.4/5。

几何后处理与导出验证

基准测试暴露了一个关键工程要点:预览正确性不等于导出正确性。Codex 5.5 High 在迭代过程中的 PNG 预览表现优异,但最终导出的 STL 文件在门廊屋顶与穹顶交界处出现了非流形面(non-manifold facets),导致评分被大幅拉低。

Antigravity 2.0 虽未在公开结果中暴露类似问题,但这一教训对生产环境至关重要。建议的导出后处理流程包括:

  1. Mesh 验证:使用 admesh 或 MeshLab 检测非流形边
  2. 布尔运算简化:避免过于细碎的接触面,保持几何体间的 clean boolean
  3. 分层导出测试:复杂模型分部件导出验证,再合并为最终 STL

速度 - 质量的权衡与选型建议

Antigravity 2.0 的速度评分仅为 1/5(约 12 分钟),与 Cursor 的极快响应形成鲜明对比。这一权衡反映了当前 LLM CAD 生成的基本规律:高质量建筑模型需要更长的规划与迭代周期。

对于实际工程选型,建议根据场景需求匹配工具:

  • 快速原型:Cursor 等轻量方案适合概念验证阶段
  • 高质量交付:Antigravity 2.0 或 Claude Sonnet 适合需要精确比例与细节的最终输出
  • 人机协作:ModelRift 的 Annotation Mode 允许用户在渲染图上直接标注修改意见,结合 Gemini Flash 3.0 可达到 3.8/5 质量且具备可控性

局限与后续方向

Antigravity 2.0 的当前实现仍存在局限。除速度较慢外,其依赖的 Gemini 3.5 Flash High 的 API 成本较上一代 Flash 提升 3 倍(输入 $1.50/1M tokens,输出 $9.00/1M tokens),在大规模生成场景下需考虑成本优化。此外,复杂模型的 STL 导出稳定性仍需额外验证环节保障。

从更宏观的视角看,OpenSCAD 基准的成功验证了文本化几何表达 + 迭代预览修订这一技术路线的可行性。未来随着多模态模型对空间关系的理解加深,结合参数化约束求解器的混合架构可能成为 3D 生成领域的新范式。


参考来源

  • ModelRift: "OpenSCAD LLM Benchmark: Building the Pantheon" (2026)
  • Hacker News 讨论: "Antigravity 2.0 Tops the OpenSCAD Architectural 3D LLM Benchmark"

ai-systems

内容声明:本文无广告投放、无付费植入。

如有事实性问题,欢迎发送勘误至 i@hotdrydog.com