在数据爆炸式增长的今天,传统的存储介质面临着严峻的挑战。硬盘的平均寿命通常只有十年左右,磁带虽然相对耐用,但也难以跨越数百年的时光。然而,2026 年微软在《自然》期刊发表的最新研究成果表明,一种全新的数据存储方式或许能够将数据的生命周期延长至万年以上 —— 这就是 Project Silica 玻璃存储技术。该技术通过飞秒激光在玻璃内部刻蚀三维数据点,实现了高密度、免维护、跨 millennia 的数据归档能力。
玻璃作为存储介质的物理基础
选择玻璃作为数据存储介质并非突发奇想,而是基于其独特的材料特性。玻璃是一种非晶态固体,其分子结构在常温下极为稳定,不像晶体那样存在明确的晶界,也不易发生化学反应。从材料科学的角度来看,硼硅酸盐玻璃(一种常用于耐热厨具的普通玻璃)具有 “热稳定性和化学稳定性,能够抵御潮湿侵入、温度波动和电磁干扰”。这意味着数据一旦写入玻璃,只要玻璃本身不被物理破坏,存储的信息可以存在数千年而不退化。与硬盘的磁介质退化和 SSD 的电荷泄漏问题相比,玻璃存储几乎不存在因材料老化导致的数据丢失风险。
值得注意的是,玻璃的稳定性在很大程度上取决于其化学成分。微软团队早期曾使用昂贵的熔融石英作为存储介质,后来成功转向价格低廉的硼硅酸盐玻璃,这一转变大幅降低了成本,为未来的商业化应用奠定了基础。虽然玻璃在日常使用中给人以 “易碎” 的印象,但在适当的封装和处理条件下,其物理强度足以应对长期的存储需求。
飞秒激光写入技术与三维体素编码
将数据写入玻璃的核心技术是飞秒激光刻蚀。飞秒激光是一种脉冲持续时间极短的激光,其脉冲宽度仅为 10⁻¹⁵ 秒,能够在极短的时间内将能量集中在极小的区域内。这种超短脉冲的特性使得激光可以在不损伤玻璃表面的前提下,在玻璃内部精确地改变材料结构,从而形成被称为 “体素”(voxel)的三维数据点。
微软团队开发了两种体素编码方案。第一种方案基于双折射效应:先用一道激光脉冲在玻璃内部形成一个椭圆形空腔,再用第二道偏振激光脉冲诱导双折射效应。由于椭圆形空腔的取向可以有多个角度,每个体素可以存储多于一位的信息。理论上,这种方法能够在极小的体积内存储大量数据。第二种方案则通过调节激光脉冲的能量来改变体素的折射率幅度,通过区分不同的折射率状态实现多位存储。第二种方案虽然数据密度略低(每块玻璃约 2TB),但对光学硬件要求更低,且可以使用任何透明材料。
写入速度是玻璃存储面临的主要挑战之一。为了提高吞吐量,微软设计了能够同时运行四路激光的写入硬件,在不产生过多热量的前提下实现了 66 兆比特每秒的写入速度。团队表示未来有可能扩展到十几路激光。以 4.84TB 的单块玻璃容量计算,完全写满一块玻璃大约需要 150 小时,这对于离线归档场景而言是可以接受的。
光学读取与神经网络解码
数据写入之后,如何准确读取是一个同样关键的问题。微软采用了相位 contrast 显微镜技术来读取玻璃内部存储的数据。由于体素会导致光的折射率发生变化,当偏振光穿过玻璃时,不同状态的体素会表现出不同的光学特性。通过精确控制显微镜的焦平面,读取系统可以逐层扫描玻璃内部的三维数据结构。
读取过程的工程实现需要解决层间干扰问题。由于体素分布在玻璃的不同深度层,每一层都与其他层存在一定的距离,以确保在某一特定焦平面只有一层的体素处于清晰成像状态。微软在刻蚀过程中还加入了用于定位的标记符号,使自动化显微镜系统能够精确定位每个数据点的位置。读取时,系统会缓慢改变焦平面,依次捕获不同层的图像。
为了从这些光学图像中准确还原原始数据,微软引入了一个卷积神经网络。该网络结合了焦平面内和焦平面附近的图像信息进行联合判断,这是因为相邻体素的存在会微妙地影响目标体素的成像表现,这种细微的差异对于人工判读而言难以捕捉,但经过大量训练数据学习的神经网络可以准确识别。最终,系统使用低密度奇偶校验码(LDPC,与 5G 网络相同的纠错码)对数据进行纠错,确保读取的准确性。
千年稳定性与工程验证
微软声称其玻璃存储介质的数据可保存超过一万年,这一结论并非空穴来风,而是基于严格的加速老化实验。研究团队在高温环境下对玻璃样本进行了加速老化测试,然后根据阿伦尼乌斯方程外推数据在室温下的稳定时间。实验结果表明,在正常使用条件下,玻璃内部的刻蚀结构可以保持一万年以上的稳定性,且实际寿命可能更长。这一特性使得玻璃存储成为国家档案馆、影视资料库和云服务商冷存储的理想选择 —— 这些场景对数据的长期保存有着极高的要求,但对访问频率的要求相对较低。
与 DNA 存储等新兴技术相比,玻璃存储还有一个显著优势:数据读取速度相对较快。DNA 存储的数据恢复可能需要数天时间,而玻璃存储在需要读取时可以快速定位并提取目标数据。此外,玻璃存储在数据保存期间完全不需要消耗能源,这与需要持续供电的硬盘和磁带形成了鲜明对比。
应用场景与现实局限性
尽管玻璃存储技术前景广阔,但其应用场景有明确的边界。该技术不适合作为日常计算或频繁访问的存储介质,而是定位于 “写入一次,很少读取” 的归档场景。典型的应用场景包括:国家图书馆和档案馆的文物数字化存档、基因测序数据的长期备份、影视制作公司的母版存档,以及超大规模科学设施的数据归档。例如,平方千米阵列望远镜每年产生约 700 PB 的数据,如果全部使用玻璃存储,仅这一台望远镜每年就需要超过 14 万块玻璃板。即使假设写入速度可以通过增加激光数量大幅提升,也需要超过 600 台 Silica 设备同时运行才能跟上数据产生的速度。
从工程落地的角度来看,当前阶段的玻璃存储系统仍处于研究原型阶段。写入速度、存储密度和单位成本之间需要权衡,批量生产设备和自动化存取系统尚待开发。然而,微软已经证明了该技术路线的可行性,并将继续推动从实验室向商业化的转变。对于需要为子孙后代保留数字遗产的组织而言,玻璃存储提供了一种前所未有的选择 —— 一种可以跨越文明周期、抵抗自然灾害和技术淘汰的存储介质。
资料来源:本文技术细节主要参考微软研究团队发表在《自然》期刊的论文(doi: 10.1038/s41586-025-10042-w)及 Ars Technica 的报道。