Sameshi：如何在 2KB 内存内构建一个 1200 Elo 的国际象棋引擎

在追求极致性能与资源占用的计算领域，国际象棋引擎一直是算法优化的试金石。从 Deep Blue 的超级计算到 Stockfish 的复杂启发式，现代引擎往往依赖海量的内存与计算资源。然而，Sameshi 项目却反其道而行之，它设定了一个近乎严苛的目标：在不超过 2KB 的内存空间内，实现一个具备约 1200 Elo 棋力的国际象棋引擎。这不仅是对算法设计的挑战，更是对代码密度和工程取舍的极限考验。本文将深入剖析 Sameshi 的核心设计，揭示其在极端约束下所采用的压缩策略与性能边界。

棋盘表示法的尺寸权衡：Mailbox 优于 Bitboard

国际象棋引擎的底层数据结构至关重要。主流的现代引擎普遍采用 ** 位棋盘（Bitboard）** 表示法，即用 64 位整数中的每一位来对应棋盘上的一个格子。这种表示法在执行棋子移动、攻击范围计算等操作时，可以利用 CPU 的位运算指令实现极高的效率。然而，位棋盘的优势背后是巨大的代码尺寸开销：为了实现复杂的滑动棋子（后、车、象）移动，通常需要引入 “魔术位棋盘”（Magic Bitboard）等查找表技术，这些预计算表格和相应的位操作函数会占用可观的存储空间。

Sameshi 在 2KB 的预算下无法承受这种开销。因此，它回归了更古典的 “邮箱”（Mailbox）表示法。具体来说，它使用了一个包含 120 个元素的数组来模拟一个 12x10 的扩展棋盘。实际的 8x8 棋盘被放置在这个扩展区域的中央，四周环绕着特殊的 “哨兵” 值。这种设计的妙处在于，当计算棋子移动时，只需检查目标格子是否为哨兵值，即可一次性判断移动是否越出棋盘边界，而无需进行繁琐的行列边界检查。虽然这种表示法在内存访问模式上不如位棋盘高效，但其对应的移动生成代码却异常紧凑。正如项目作者在 Hacker News 讨论中所述，“With mailbox you just need offset tables and a sentinel check for board edges”，这正是尺寸优先策略下的明智选择。

搜索框架的极简主义：Negamax 与 Alpha-Beta 剪枝

确定了棋盘表示法后，搜索算法成为下一个需要精简的核心。Sameshi 采用了 Negamax 算法，这是 Minimax 算法的一种变体，它通过统一看待双方玩家的估值函数，将代码逻辑几乎减半。Negamax 本身并不减少搜索的节点数，但它为结合 Alpha-Beta 剪枝 提供了简洁的框架。

Alpha-Beta 剪枝是此类极小尺寸引擎能够达到一定深度的关键。它通过传递两个边界值（alpha 和 beta）来 “剪掉” 那些不可能影响最终决策的子树，从而在不牺牲结果正确性的前提下，显著减少需要评估的局面数量。Sameshi 实现了基本的 Alpha-Beta 剪枝，但为了节省代码，它放弃了许多大型引擎标配的优化，例如置换表（Transposition Table）和历史启发式（History Heuristic）。置换表可以缓存已搜索局面的结果，避免重复计算；历史启发式则能基于过往经验对走法进行更智能的排序，从而提升剪枝效率。然而，实现这些功能需要额外的哈希表和数据结构，必然会突破 2KB 的限制。

评估函数：当 “价值” 只剩下 “子力”

评估函数负责为一个棋盘局面打分，是引擎 “智能” 的体现。强大的引擎会综合考虑子力价值、棋子位置、王的安全度、兵形结构等数十甚至上百项因素。Sameshi 的评估函数则走到了另一个极端：仅基于子力价值。它简单地将棋盘上剩余棋子的价值相加（例如，后 = 9，车 = 5，马 / 象 = 3，兵 = 1），并以此作为局面的分数。

放弃任何形式的棋格表（Piece-Square Table） 是另一个关键的尺寸妥协。棋格表为每种棋子在棋盘的不同位置赋予额外的奖励或惩罚（例如，将马放在中心通常更好），这能极大地提升引擎的位置性理解。一个完整的棋格表至少需要 64（格子）* 6（棋子类型）* 2（颜色） = 768 个数值。即使使用 8 位整数存储，这也需要近 768 字节，对于总预算仅 2048 字节的 Sameshi 而言是不可承受之重。因此，Sameshi 的 “智能” 几乎完全依赖于其搜索深度，而非局面的静态评估精度。

功能取舍与性能边界

为了严守 2KB 红线，Sameshi 在功能上做出了明确取舍。根据其 GitHub 仓库的说明，它未实现王车易位、吃过路兵、兵升变、重复局面检测和 50 步规则。这些规则，尤其是前三项，在现代对局中频繁出现。这一决策直接影响了其评级的意义：项目测得的约 1170 Elo 是在一个 “禁用易位、吃过路兵和升变” 的变体规则下，与特定配置的 Stockfish 对弈 240 局后估算得出的。这意味着该评级不能直接等同于在标准国际象棋规则下的实力。

在性能方面，Sameshi 采用固定搜索深度为 5 层，并辅以简单的 “吃子优先” 走法排序。这种排序虽然廉价，但能有效提升 Alpha-Beta 剪枝的效率，因为优先搜索可能带来重大价值变化的吃子走法，有助于更早地触发剪枝。即便如此，与那些占用 4KB 的引擎相比，Sameshi 的棋力差距依然显著。Hacker News 的评论指出，“The gap between your 1200 Elo in 2KB and the TCEC 4K engines at ~3000 Elo is interesting”。这多出的 2KB 空间，允许引擎引入更复杂的评估函数、更高效的走法排序（如杀手启发式）以及置换表，从而将棋力提升至超越人类顶尖水平的层次。这清晰地展示了在算法优化中，每一字节所能换取的性能收益。

结论：极端约束下的工程启示

Sameshi 项目远非一个实用的象棋引擎，但它是一个杰出的思想实验和工程艺术品。它生动地演示了在资源极度受限的环境下（例如早期的嵌入式系统、极简的微控制器或代码高尔夫挑战），开发者应如何思考问题：

优先选择代码密度高的算法：有时，更古老、更简单的算法因其实现紧凑而优于现代高效但复杂的算法。
明确核心价值，果断舍弃边缘功能：Sameshi 抓住了象棋引擎最核心的搜索与基本评估，果断放弃了部分标准规则，从而守住了主要目标。
理解性能与资源的非线性关系：从 2KB 到 4KB，棋力发生了跃迁。这提醒我们，在资源瓶颈附近，微小的增量可能带来巨大的性能提升。

最终，Sameshi 像 demoscene 文化中的许多作品一样，其价值不仅在于 “做了什么”，更在于 “在何等限制下做到”。它挑战了我们对软件复杂性与能力之间关系的直觉，为算法压缩与优化提供了一个极具参考价值的微型案例。

资料来源

Sameshi GitHub 仓库：https://github.com/datavorous/sameshi
Hacker News 讨论：https://news.ycombinator.com/item?id=47014500