在沙特阿拉伯 Alghat 沙漠的峭壁下,一块酷似贝壳的岩石引发了跨学科的技术探索。这块化石距离最近的海岸线超过 500 公里,地质年代可追溯至约 1.5 亿年前的侏罗纪晚期。作者 Hawzen 在缺乏古生物学专业背景的情况下,构建了一套基于形态学分析的自动化识别 pipeline,试图通过计算手段回答 "这是什么生物" 的问题。
这个项目展示了如何将计算机视觉中的形状分析技术迁移到古生物鉴定领域,其核心方法论 —— 轮廓提取、标准化变换、PCA 降维与最近邻匹配 —— 对任何需要处理高维几何数据的工程场景都具有参考价值。
技术架构:从图像到潜在空间
整个 pipeline 的设计遵循 "归一化 - 表征 - 降维 - 匹配" 的经典流程。输入是 Zhang 等人提供的贝壳图像数据集,包含 7894 个物种的 59244 张图片;输出是化石在形态学空间中的位置坐标及其最相似的现生物种。
关键的技术决策在于形状表征的选择。作者放弃了传统的基于特征工程的方法(如长宽比、曲率统计量),而是直接提取轮廓点云作为原始表征。每张贝壳图像被转换为 256 个二维坐标点,形成一个 512 维的向量(256×2)。这种选择的优势在于保留了完整的边界信息,避免了人为定义特征可能引入的偏见;代价是维度灾难和姿态变化的干扰。
数据预处理:消除无关变异
在将原始图像转换为可比较的形状向量之前,必须消除三类无关变异:平移、缩放和旋转。
平移归一化通过将轮廓质心移至坐标原点实现。缩放归一化将所有样本的最大径向距离统一为 1,确保大小不同的贝壳可以在同一尺度下比较。这两步相对直接,但旋转对齐是形态学分析中的经典难题。
作者采用的启发式策略是:以轮廓点到质心的最长距离作为参考轴,将所有样本旋转至该轴指向右侧(0 度方向)。这种方法假设贝壳的 "开口方向" 与最长半径方向存在相关性,虽然不完美,但在数据集内部保持了一致性。
经过上述变换,每个贝壳被表示为一个 256×2 的矩阵,行代表轮廓点,列代表归一化后的 x、y 坐标。
距离度量与降维策略
形状之间的相似性通过欧几里得距离计算:对两个贝壳的轮廓矩阵逐点求差,累加平方误差后开方。这种度量直观且计算高效,但对噪声和采样不均匀敏感。
原始 512 维空间过于稀疏,直接在此空间中进行最近邻搜索效率低下且难以可视化。作者采用主成分分析(PCA)进行降维,将数据投影到前两个主成分构成的平面上。实验结果显示,仅 PC1 就保留了 56.50% 的方差,PC1+PC2 合计保留 67.25% 的方差 —— 这意味着用两个数字就能以较高精度描述一个贝壳的形状特征。
更有趣的是主成分的可解释性。通过寻找在 PC1 维度上差异最大、而在其他维度上相似的样本对,作者发现 PC1 捕捉的是 "尖锐度"(pointiness):负值代表圆润形态,正值代表尖锐形态。PC2 则似乎与对称性相关,负值区域对应不对称形状。这种可解释性为后续的生物学分析提供了直观线索。
工程实现要点
对于希望复现或迁移此方法的工程团队,以下参数配置值得参考:
轮廓采样:256 个点的分辨率在细节保留与计算开销之间取得了平衡。点数过少会丢失关键曲率信息,过多则增加噪声敏感度。
PCA 组件选择:前两个主成分足以捕捉大部分形状变异,但若需更高精度,可考虑保留 5-10 个组件,通常能覆盖 85% 以上的方差。
距离阈值设定:在潜在空间中进行最近邻搜索时,建议设置距离阈值过滤明显异常的匹配结果。具体阈值需根据数据集分布通过交叉验证确定。
姿态鲁棒性:若应用场景中存在大量非标准视角的输入,建议在预处理阶段引入基于主方向估计的旋转对齐,或考虑使用旋转不变的距离度量(如形状上下文描述子)。
局限性与跨学科启示
该项目的最终匹配结果揭示了形态学分析的固有局限:化石与现生物种 Sphincterochila candidissima 在形状空间中距离最近,但这种物种的最早化石记录仅 3800 万年前,远晚于目标化石的侏罗纪年代。这一矛盾指向趋同进化的可能性 —— 不同谱系的生物因适应相似环境压力而独立演化出相似形态。
这一案例说明,纯几何分析无法替代谱系学和地层学的证据。在工程实践中,这意味着任何基于形态匹配的识别系统都应输出置信度评分,并在置信度不足时触发人工审核流程。
尽管如此,这套 pipeline 在快速筛选候选物种、生成可验证假设方面展现了计算方法的独特价值。作者已将工具部署至 https://shell.hawzen.me,允许用户上传贝壳图像并查看其在形态学空间中的位置 —— 这种 "可交互的科学探索" 模式,或许比单一的鉴定结果更具教育意义。
资料来源
- GitHub 仓库: https://github.com/Hawzen/I-found-a-seashell-in-the-middle-of-the-desert
- 在线演示: https://shell.hawzen.me
内容声明:本文无广告投放、无付费植入。
如有事实性问题,欢迎发送勘误至 i@hotdrydog.com。