HN精选｜AI建模对决万神殿

用代码重建两千年前的建筑奇迹

如果你想让一个 AI 从零开始用代码构建罗马万神殿，谁会做得最好？ModelRift 团队设计了这样一个基准测试：给多个 AI 编程工具相同的任务——仅凭参考图片，用 OpenSCAD 参数化建模语言重建万神殿的完整结构，包括圆形大厅、穹顶、门廊、科林斯柱、三角楣饰等所有标志性建筑元素。

这不是一个简单的”画个立方体挖个洞”的基础测试。万神殿的复杂性在于它需要精确的空间推理能力——AI 必须理解圆顶的几何关系、柱廊的比例、以及各个构件之间的布尔运算组合。

六强对决：Antigravity 意外登顶

参与测试的六位选手分别是：Google Antigravity 2.0（Gemini 3.5 Flash High）、ModelRift（Gemini Flash 3.0）、Codex 5.5 High、Claude Sonnet、Cursor Composer 和 Claude Opus。结果出人意料：Google Antigravity 2.0 获得最高评价。

最令人印象深刻的是，Antigravity 是唯一一个实现了万神殿标志性内部天花板图案的自主代理——重复的方形藻井（coffer）从穹顶内部可见，透过圆洞（oculus）可以看到。其他模型要么忽略了内部结构，要么只建模了外部形态。

ModelRift 团队提供了每个模型的 3D 渲染图和可交互的在线查看链接，让读者可以直观比较各模型的输出质量。从柱廊的对称性到穹顶的比例，Antigravity 在多个维度上都表现最佳。

社区的质疑声

HN 社区对这个基准测试提出了几个有见地的批评。最尖锐的一条指出：万神殿是世界上最著名的建筑之一，有海量的训练数据（照片、3D模型、建筑图纸），Antigravity 可能只是”回忆”了训练数据中的万神殿，而非真正从参考图片中推理出几何结构。

正如一位评论者所言：”一个更严格的测试是让 AI 建模一个匿名建筑——只基于提供的参考图片，没有任何先验知识。”

另有用户对仅用一个3D模型、一次尝试就宣称”基准测试”表示不以为然：”单个真实世界物体不能构成基准。你需要像《铁人料理》那样——给定一个主题（如希腊建筑），由评审判定胜者。”

还有用户分享了实际操作中的挫折：”你可能第一次得到一个勉强可用的草稿，然后开始’调试’，经过一段非常令人沮丧的过程后，你发现模型根本无法真正’看到’结果——它无法在此基础上迭代。”

但这不是重点

尽管有这些合理质疑，这个基准测试的价值不在于宣称某个模型”绝对更好”，而在于它为评估 LLM 的空间推理能力提供了一个可复现的实用框架。随着 AI 越来越多地介入 CAD、3D打印、建筑设计和游戏开发领域，模型能否从视觉参考转化为精确的几何代码这个问题的答案将直接影响这些行业的自动化进程。

Antigravity 实现了内部藻井这一事实——无论是因为训练数据的记忆还是真正的几何理解——至少说明它具备了将复杂空间关系转化为代码的能力。这本身就是重要的工程进步。

📎 原文链接：ModelRift Blog
💬 HN 讨论：news.ycombinator.com

用代码重建两千年前的建筑奇迹

六强对决：Antigravity 意外登顶

社区的质疑声

但这不是重点

Leave a ReplyCancel Reply