可微分细胞自动机形态发生：从种子到自修复图案的神经网络训练

生物形态发生（Morphogenesis）是生命最惊人的能力之一：从单一受精卵开始，细胞通过局部相互作用自组织成复杂的多细胞结构，且能在受损后再生。这种分布式、鲁棒的自组织能力长期以来被视为生命系统的专属特性。然而，2020 年 Google Research 团队在 Distill 发表的开创性工作 "Growing Neural Cellular Automata" 证明，通过将传统细胞自动机（CA）与可微分编程结合，我们可以训练神经网络学习类似的形态发生规则。这一方法不仅实现了从种子状态生长目标图案，更展现出令人惊讶的自修复能力 —— 而系统从未被显式训练过修复行为。

从离散规则到可微分更新

传统细胞自动机（如康威生命游戏）依赖人工设计的离散规则：每个细胞根据邻居状态遵循固定的状态转移表。这种设计方式虽然能产生复杂行为，但规则设计完全依赖直觉，且难以针对特定目标优化。神经细胞自动机（Neural CA）的核心创新在于将离散规则替换为可微分的神经网络，从而允许使用梯度下降自动学习更新规则。

在实现层面，每个细胞的状态表示为一个 16 维连续向量：前 3 个通道对应可见的 RGB 颜色，第 4 个是 Alpha 通道（用于区分活细胞与背景），剩余 12 个是隐藏通道，可理解为细胞内部的化学信号或电位状态。这种连续表示使得整个系统可以通过反向传播进行端到端训练。

更新规则遵循严格的局部性原则，模拟真实生物细胞的感知 - 决策过程：

感知阶段使用固定的 Sobel 滤波器计算各通道在 x 和 y 方向的梯度，形成 48 维感知向量。这模拟了生物细胞通过化学梯度感知环境的能力 —— 细胞不需要知道全局状态，仅需感知局部浓度变化即可做出决策。

更新阶段将感知向量输入一个约 8000 参数的小型神经网络（由 1x1 卷积和 ReLU 激活组成），输出状态增量。受残差网络启发，更新采用增量形式：新状态 = 旧状态 + 增量。关键设计是将最终卷积层的权重初始化为零，使系统初始表现为 "什么都不做" 的恒等映射，随后通过训练学习有意义的更新。

随机异步更新打破了传统 CA 的全局同步假设。每个时间步，细胞以 50% 概率被随机屏蔽更新，模拟真实生物系统中不存在全局时钟的情况。这种设计迫使系统学习对更新顺序不敏感的鲁棒规则。

活性掩码确保计算仅在 "活细胞" 及其直接邻居上进行。Alpha 通道大于 0.1 的细胞被视为成熟细胞，其邻居为生长细胞；远离生长区域的细胞状态被强制置零，避免无效计算。

Sample Pool：训练稳定性的关键

直接使用时间反向传播（BPTT）训练 CA 面临一个根本难题：系统容易陷入不稳定状态。早期实验表明，模型虽能从种子生长出目标图案，但继续迭代后会出现过度生长或崩溃。这类似于动力系统中的轨迹发散问题 —— 目标状态并非吸引子。

研究团队提出的 Sample Pool 策略巧妙解决了这一问题。训练过程中维护一个包含 1024 个样本的池子，每个样本代表系统可能处于的某个中间状态。训练时从池中随机采样批次，将损失最高的样本替换回种子状态以防止遗忘，然后将训练后的输出状态重新存入池中。这一策略强制系统学会从任意中间状态恢复目标图案，相当于将目标状态塑造为动力学吸引子。

更具启发性的是 "损伤训练" 变体：在 Sample Pool 基础上，对采样的部分状态随机擦除圆形区域后再进行训练。这种显式的损伤暴露使系统发展出强大的再生能力 —— 即使面对训练中未见过的损伤类型（如矩形切口），模型仍能恢复目标图案。这揭示了自修复能力可以通过适当的训练策略涌现，而非需要显式编码。

旋转不变性与几何泛化

一个令人惊讶的发现是感知场的几何性质对图案生成的影响。通过旋转 Sobel 滤波器的坐标轴（即改变梯度计算的方向），可以在不重新训练的情况下生成旋转版本的目标图案。这一特性暗示系统学习到了某种内在的旋转等变性 —— 尽管训练仅在固定方向上进行，但神经网络学会了提取与方向无关的特征。

在像素离散化的网格上实现连续旋转并非易事，传统图像旋转需要插值处理。NCA 的成功表明，基于梯度的局部感知机制具有天然的几何鲁棒性，这为设计几何不变的学习系统提供了新思路。

2024-2025 年的拓展与深化

自 2020 年原始工作发表以来，NCA 研究在多个方向取得显著进展。2024 年的 3D 形态发生工作将系统扩展到三维空间，实现了类组织结构的自组织生长与再生，为计算发育生物学和合成形态学提供了更真实的模型。这一扩展不仅增加了空间维度，还引入了各向同性约束，确保生长行为不依赖于特定的空间取向。

在应用层面，NCA 正从形态发生玩具模型演变为通用机器学习组件。2024 年 NeurIPS 的工作展示了将 NCA 作为视觉 Transformer 的鲁棒性适配器（AdanCA），利用其局部自组织能力增强模型对扰动的抵抗能力。更引人注目的是 2025 年 ARC-AGI（抽象推理语料库）上的应用尝试 —— 研究人员探索 NCA 是否能够通过自组织机制解决 few-shot 抽象网格推理任务，这将其适用范围从物理形态发生拓展到符号推理领域。

2025 年的综述研究将 NCA 定位为连接生物学自组织、再生医学和机器人控制的统一框架。研究者发现，隐藏通道不仅作为计算中介，还可能编码空间记忆信息，支持系统的持久性和模式修复。这一发现为理解 "形态发生代码"—— 即指定大规模解剖结构的细胞级算法 —— 提供了新的计算视角。

工程实践要点

对于希望复现或应用 NCA 的工程师，以下参数和策略至关重要：

状态维度：16 维是经验平衡点 —— 过少通道限制表达能力，过多增加训练难度。RGB+Alpha+12 隐藏通道的配置在 Distill 工作中被验证有效。

训练稳定性：直接使用 BPTT 容易出现损失突变。建议对参数梯度应用逐变量 L2 归一化，这类似于权重归一化的效果，可显著稳定训练。

迭代步数：训练时从 64-96 步范围内随机采样，确保图案在该时间窗口内稳定。测试时可扩展到更长步数以验证长期稳定性。

Pool 大小：1024 个样本的 Pool 在 64x64 网格上表现良好。Pool 过小导致多样性不足，过大增加内存开销。

损伤训练：若需再生能力，建议在训练后期引入随机圆形擦除（半径约为图案尺寸的 10-20%），通常 3-5 个损伤样本每批次即可显著提升鲁棒性。

感知核：Sobel 滤波器是可靠起点，但可尝试可学习的感知核。固定感知核的优势在于模拟生物化学梯度的物理约束，但可学习核可能在特定任务上表现更优。

局限与未来方向

当前 NCA 方法仍存在显著局限。长期行为预测困难 —— 即使训练稳定的模型，在极长时间迭代后仍可能进入未探索的动力学状态。此外，训练过程需要大量计算资源，BPTT 的内存需求随序列长度线性增长，限制了可训练的迭代深度。

从理论视角，NCA 与反应 - 扩散系统（如 Turing 模式）、图神经网络和点云处理存在深刻联系。未来研究可能探索：将 NCA 与强化学习结合实现目标导向的生长控制；利用神经架构搜索自动发现更高效的细胞更新规则；以及将形态发生原理应用于自组织机器人和可重构材料设计。

结语

可微分细胞自动机形态发生展示了深度学习与复杂系统理论的交汇点：通过梯度下降，我们可以学习出表现出涌现集体行为的局部规则。从单细胞种子到自修复图案，NCA 不仅提供了理解生物形态发生的计算模型，更为设计自适应、鲁棒的分布式系统开辟了新路径。随着 3D 扩展、推理任务应用和生物学验证的推进，这一领域正从概念验证走向实际应用，有望在再生医学、机器学习和材料科学中发挥重要作用。

参考来源

Mordvintsev et al., "Growing Neural Cellular Automata," Distill, 2020. https://distill.pub/2020/growing-ca/
Hartl et al., "Neural cellular automata: Applications to biology and beyond classical AI," 2025.
"Artificial morphogenesis via 3D neural cellular automata," University of Texas at Austin, 2024.

ai-systems

内容声明：本文无广告投放、无付费植入。

如有事实性问题，欢迎发送勘误至 i@hotdrydog.com。