Hotdry.

Article

空气 DNA 检测技术与生态监测:从采样到测序的完整 pipeline

详解空气环境 DNA (eDNA) 的采样方法、DNA 提取、测序策略与生物信息学分析流程,为生态监测与生物多样性评估提供可落地的工程参数。

2026-04-21systems

当我们谈论环境 DNA (eDNA) 时,首先想到的往往是水体或土壤中的遗传物质检测。然而,近五年来,一种更为前沿的检测方法正在快速崛起 —— 从空气中捕获 DNA。空气 eDNA (airborne eDNA) 技术的突破让研究人员无需直接接触生物个体,即可通过采样空气中的微量 DNA 片段,实现对区域生物多样性的远程监测。这一技术在生态学、流行病学入侵物种预警等领域展现出巨大潜力,但其落地应用仍面临采样标准化、提取效率、污染控制等多重工程挑战。本文将系统梳理空气 eDNA 检测的完整技术 pipeline,给出可操作的参数建议与最佳实践。

采样方法:被动采样与主动采样的技术选型

空气 eDNA 的核心第一步是空气中 DNA 的捕获。根据采样原理的不同,当前主流方法分为被动采样与主动采样两大类。被动采样依赖自然气流通过吸附材料,最典型的装置是被动空气采样器 (passive sampler),如_polytetrafluoroethylene_ (PTFE) 滤膜或聚酯纤维基质。这类装置成本低廉、可部署于偏远地区,适合长期连续监测,但 DNA 捕获效率受气流速率与环境风速影响较大,单一样本的 DNA 载量通常较低。主动采样则通过泵或真空系统以恒定流速强制空气通过滤膜,能够精确控制采样体积,单位时间内捕获的 DNA 量显著高于被动方式。主动采样器的典型流速设置在 100–300 L/min,单次采样体积可达数百至上千立方米,能够显著提升低丰度物种的检出率。

在实际部署中,采样高度与时长是常被忽视的关键参数。多数研究表明,采样位置应贴近目标生物的活动区域 —— 例如监测鸟类时将采样器设于树冠层,监测小型哺乳动物时则置于地面植被层。采样时长的设计需权衡检测灵敏度与时间成本:时间过短可能导致 DNA 载量不足,过长则增加环境降解与污染风险。建议在开展正式监测前,通过预实验确定本环境的最优采样体积与时长组合。

DNA 提取:从低生物量样本中回收遗传物质

空气滤膜上的 DNA 含量通常极低,属于典型的低生物量 (low-biomass) 样本,提取过程需要格外谨慎。商业化的磁珠法提取试剂盒 (如 Qiagen DNeasy PowerWater Kit 或 MagMAX eDNA Isolation Kit) 是当前的主流选择,这类方法在提取效率与污染控制之间取得了较好平衡。提取流程中务必加入机械裂解步骤 —— 使用珠磨仪 (bead-beating) 对滤膜进行高速震荡,以物理破碎方式释放黏附在颗粒物表面的 DNA,这一操作对来自土壤或尘埃的样本尤为关键。

值得注意的是,空气样本中常含有 PCR 抑制剂,包括灰尘中的腐殖酸、采样设备析出的挥发性有机物等。提取完成后,建议使用内参 PCR 或已知浓度的外标 spike-in 评估提取效率与抑制剂残留情况。若检测到显著抑制效应,可在 PCR 反应体系中添加 BSA (牛血清白蛋白) 或使用耐抑制剂的高保真 DNA 聚合酶 (如 Phusion U 绿色 Mix)。同时,每批次提取必须包含阴性对照 (空白滤膜随同处理),用于监测提取试剂与环境引入的污染。

测序策略:扩增子与宏基因组的取舍

获得高质量 DNA 提取物后,测序策略的选择直接决定了检测的广度与深度。当前空气 eDNA 分析主要有两条技术路线:基于标记基因的扩增子测序 (amplicon sequencing /metabarcoding) 与非靶向的宏基因组测序 (shotgun metagenomics)。

扩增子测序通过 PCR 扩增特定保守基因区域来检测目标类群。动物 eDNA 常用线粒体 COI (cytochrome oxidase I) 基因或 12S rRNA 基因,植物使用 rbcL 或 trnH-psbA,微生物则常用 16S/18S rRNA 基因。其优势在于成本相对较低、数据分析成熟、灵敏度较高 —— 即使 DNA 总量有限,也能通过多重 PCR 扩增获得可观的序列 reads。缺点是引物偏好性强,不同类群的扩增效率差异显著,可能导致部分物种被遗漏或相对丰度估计偏差。

宏基因组测序则对全部 DNA 进行无偏好测序,能够捕获更广泛的分类群,甚至获得功能基因信息与种群遗传变异数据。2025 年发表在 Nature Ecology & Evolution 上的研究首次展示了宏基因组空气 eDNA 测序实现整 Biome 快速评估与种群遗传分析的能力。然而,宏基因组对 DNA 总量与测序深度要求更高,单样本测序成本可达扩增子测序的数倍,且数据处理流程更为复杂。

对于刚入门空气 eDNA 监测的团队,建议从扩增子测序起步,选择一套经过充分验证的引物对 (如针对脊椎动物的 MiFish 或针对昆虫的 Leray primer),待流程成熟后再逐步引入宏基因组方法。

生物信息学分析:从 raw reads 到物种注释

测序下机后的数据分析是决定最终检测结果可信度的关键环节。典型的空气 eDNA 生物信息学 pipeline 包括以下步骤:原始 reads 质量控制 (使用 FastQC 或 fastp 评估,Trimmomatic 过滤低质量序列与接头污染)、去宿主序列 (通过 bowtie2 或 BWA 将比对到已知宿主基因组的 reads 移除)、ASV (amplicon sequence variant) 聚类或宏基因组分箱 (使用 DADA2 或 SWARM 获得去噪后的序列变体)、比对参考数据库进行物种注释。

参考数据库的选择直接影响注释结果的准确性。通用数据库如 SILVA (原核生物)、UNITE (真菌) 或 NCBI NT/NR 可覆盖较大范围的分类群,但对于非模型生物或地区特有种,注释覆盖率可能不足。建议针对监测区域构建本地化参考数据库,将已发表的当地物种 DNA 条形码序列纳入,可显著提升注释精度。阴性对照中出现的序列应视为污染并在后续分析中剔除或标记。

多样性分析通常包括 α 多样性 (物种丰富度、Shannon 指数) 与 β 多样性 (Bray-Curtis、Jaccard 距离) 计算,用于比较不同采样点或时间段的生物群落差异。数据标准化方面,由于空气 eDNA 样本的测序深度差异较大,推荐使用稀疏化 (rarefaction) 或基于负二项分布的模型标准化方法 (如 DESeq2) 来降低测序深度偏差对多样性指标的影响。

落地参数清单与监控要点

将空气 eDNA 技术真正应用于生态监测项目时,以下参数与监控要点值得关注。采样阶段,记录采样器的型号与序列号、采样流量 (L/min)、采样体积 (m³)、采样高度 (m)、环境温度与相对湿度、风速与风向;每批次包含至少 3 个空白对照与 1 个阳性对照 (已知 DNA 浓度的标准品)。提取阶段,记录提取试剂盒批号、提取仪型号、是否使用机械裂解、提取日期与操作人员;提取空白对照的 Ct 值若低于 35,需评估是否存在系统性污染。测序阶段,记录测序平台、读长配置 (如 2×250 bp)、上机文库浓度、每个样本的绿色 reads 数与质量分布。分析阶段,记录使用的数据库版本与来源、ASV 聚类参数、物种注释置信度阈值 (通常设定为 80–90% identity)、是否进行了去宿主与去污染处理。

技术局限与未来方向

尽管空气 eDNA 技术发展迅速,其规模化应用仍面临若干局限。首先是定量能力的不足 —— 空气中的 DNA 浓度受气流、温度、紫外线降解等多因素影响,从检测到的序列丰度推断实际物种丰度仍缺乏可靠的转化模型。其次是空间分辨率的挑战,单点采样难以反映大尺度区域的生物多样性分布格局,目前的解决方案是网格化布点结合时间序列连续采样。第三是标准化程度的不足,不同研究团队在采样设备、提取方法、引物选择等环节的差异导致结果可比性较差,国际上正在推进的 eDNA 标准工作框架 (如 GEOBON eDNA 工作组) 试图建立统一的操作规范。

从工程实践角度看,空气 eDNA 监测的成本已从早期的实验室概念验证下降至可接受水平 —— 一个中等规模的区域性生物多样性调查项目,采用扩增子测序路线的单样本总成本可控制在数十美元以内。随着采样设备的微型化 (如基于电池供电的便携式采样器) 与测序成本的持续下降,空气 eDNA 有望在未来三至五年内成为生态监测网络的常规技术手段,与传统调查方法形成互补。

资料来源:本文技术细节参考了 Nature Ecology & Evolution 2025 年发表的宏基因组空气 eDNA 研究、NIH PMC 发布的 Aircraft surveys for air eDNA 技术综述,以及 PubMed 收录的 2025–2026 年相关方法学论文。

systems