Hotdry.

Article

核函数可视化入门:从高维映射到高斯过程建模

通过交互式可视化理解核函数如何将低维非线性数据映射到高维空间,以及在高斯过程中选择合适核函数的实践指南。

2026-06-08mlops

在低维空间中看似杂乱无章、无法线性分割的数据,往往在高维空间中呈现出清晰可分的结构。核函数(Kernel Function)正是实现这一映射的数学工具,它允许我们在不显式计算高维坐标的情况下,直接在原始空间度量数据点之间的相似性。本文结合可视化案例,从高斯过程(Gaussian Process, GP)的视角切入,探讨核函数的核心原理与工程实践。

核函数的本质:相似性度量

在高斯过程框架中,核函数 $k (x, x')$ 的作用是计算任意两点之间的协方差,即 $k (x, x') = \text {Cov}(f (x), f (x'))$。这一协方差矩阵决定了 GP 先验的形状 —— 它编码了 "哪些函数值应该一起变化" 的假设。从几何直觉上看,核函数输出越大,表示两个输入点在函数空间中越接近;输出为零,则意味着两者相互独立。

这种相似性度量可以通过核技巧(Kernel Trick)隐式实现高维映射。以经典的径向基函数(RBF)核为例,其形式为 $k (x, x') = \exp\left (-\frac {d (x,x')^2}{2\ell^2}\right)$,其中 $\ell$ 为长度尺度参数。该核将欧氏距离映射到指数衰减的相似度空间,等效于将数据投影到无限维的特征空间,而无需显式构造映射函数 $\phi (x)$。

可视化解读:先验采样与协方差热图

理解核函数行为的有效方式是观察其在 GP 先验中的表现。通过从多元高斯分布 $\mathcal {N}(0, K)$ 采样,我们可以生成符合特定核函数假设的随机函数曲线。同时,协方差热图(Covariance Heatmap)以矩阵形式直观展示任意两点间的相关性强度 —— 对角线区域明亮表示自相似性,非对角线区域的亮度则揭示了数据点间的相互影响范围。

不同核函数在这两种可视化中呈现出鲜明特征。线性核 $k (x, x') = x^\top x'$ 产生严格的直线函数,其协方差热图呈现规则的线性梯度。周期性核 $\exp\left (-\frac {2\sin^2 (\pi d/p)}{\ell^2}\right)$ 则生成重复的波形模式,热图中可见周期性的高相关区域。RBF 核产生平滑的函数曲线,其热图以原点为中心向外辐射衰减;而 Matérn 核通过参数 $\nu$ 控制平滑度,较小的 $\nu$ 值(如 1.2)产生更粗糙、更具局部敏感性的函数,较大的值(如 2.5)则逼近 RBF 的无限可微特性。

常用核函数速查与参数调优

在实际建模中,核函数的选择应基于对数据模式的先验认知。以下是几种常用核函数及其关键参数的工程化使用建议:

RBF 核:适合建模平滑变化的数据。长度尺度 $\ell$ 控制函数的 "灵活性"—— 小 $\ell$ 使模型对局部波动敏感,大 $\ell$ 则强制函数缓慢变化。在贝叶斯优化等场景中,RBF 常作为默认选择。

Matérn 核:RBF 的广义形式,通过 $\nu$ 参数调节平滑度。当数据包含噪声或突变时,选择较小的 $\nu$(如 0.5 或 1.5)比 RBF 更能捕捉局部特征。当 $\nu \to \infty$ 时,Matérn 收敛于 RBF。

周期核:适用于具有明确周期性的数据,如时间序列中的季节性模式。周期参数 $p$ 需根据领域知识设定(如年度数据 $p=365$),长度尺度 $\ell$ 控制每个周期内的变化幅度。

有理二次核:可视为多个不同长度尺度的 RBF 核的混合,通过参数 $\alpha$ 控制混合权重。当数据存在多尺度变化特征时,该核比单一 RBF 更具表达能力。

组合策略:加法与乘法的语义差异

核函数的组合操作是高斯过程建模的强大特性。加法组合 $k_1 + k_2$ 意味着数据可分解为两种独立模式的叠加 —— 例如同时捕捉线性趋势和周期性波动。乘法组合 $k_1 \times k_2$ 则要求两种模式同时成立,产生更具约束性的函数形状。

实践中,线性核与周期核的加法组合常用于趋势加季节性的时间序列建模;而 RBF 与周期核的乘法组合可产生振幅随位置变化的调制波形。理解这些组合的语义差异,有助于构建符合领域知识的结构化先验。

工程落地建议

将核函数应用于生产环境时,建议遵循以下实践路径:首先通过探索性数据分析识别数据的主要模式(趋势、周期性、局部相关性);其次选择能够表达这些模式的核函数或组合;然后使用可视化工具验证先验假设与数据特征的一致性;最后在验证集上通过边际似然或交叉验证进行超参数优化。

对于高维输入空间,可考虑使用自动相关性确定(ARD)变体,为每个输入维度分配独立的长度尺度,实现特征选择效果。此外,当数据规模较大时,应采用稀疏 GP 或随机变分推断等近似方法,将计算复杂度从 $O (n^3)$ 降至可接受范围。

核函数的选择本质上是向模型注入领域知识的过程。通过可视化工具直观理解不同核函数的行为特征,结合实际数据的模式分析,可以构建更具解释性和泛化能力的概率模型。


参考来源

  • Kelvin Paschal, "Beautiful Kernel Functions and How to See Them", 2026. 原文提供了完整的可视化图表与交互式 Colab Notebook。
  • 相关讨论见 Hacker News 技术社区。

mlops

内容声明:本文无广告投放、无付费植入。

如有事实性问题,欢迎发送勘误至 i@hotdrydog.com