Hotdry.

Article

Kronos:面向金融市场的领域专用基础模型与 OHLCV 序列的 Token 化策略

解析 Kronos 如何将 K 线序列转化为离散 Token,实现跨市场零样本预测,并探讨从原始信号到生产级 Alpha 的工程化路径。

2026-05-25ai-systems

金融时间序列预测长期面临一个根本矛盾:市场数据具有高噪声、非平稳、多尺度耦合的特性,而通用时间序列基础模型(TSFM)往往难以捕捉这些领域特有的模式。Kronos 作为首个专门针对金融市场 K 线数据(OHLCV)设计的开源基础模型,通过将价格序列视为一种 "市场语言",在零样本场景下实现了显著的性能提升。

从连续价格到离散 Token:金融数据的语言化表征

传统时间序列模型直接处理连续数值,但金融 K 线数据包含开盘价、最高价、最低价、收盘价和成交量五个维度,且各维度之间存在复杂的约束关系(如 high ≥ close ≥ low)。Kronos 的核心创新在于引入了一个专门的分词器(Tokenizer),将连续的多维 OHLCV 数据量化为层次化的离散 Token 序列。

这种 Token 化策略借鉴了自然语言处理中的子词分词思想,但针对金融数据的特性进行了专门设计。具体而言,分词器首先对原始价格数据进行归一化处理,然后通过向量量化(Vector Quantization)将连续的 K 线映射到离散的 Codebook 条目。这种表征方式使得模型能够以自回归方式预测下一个 "价格词",类似于 GPT 预测下一个文本 Token。

该方法的工程价值在于统一了预测任务的输入输出格式。无论是价格预测、波动率估计还是合成 K 线生成,都可以转化为相同的 Token 预测问题,从而支持多任务联合训练。模型在 45 个以上全球交易所的数据上进行预训练,涵盖了超过 120 亿条 K 线记录和 7 种时间频率,形成了对跨市场、跨品种价格模式的深度理解。

两阶段架构:分词器与预测器的协同训练

Kronos 采用两阶段训练框架。第一阶段专注于训练分词器,使其能够高效地将 OHLCV 数据压缩为离散表征;第二阶段则在大规模 Token 序列上预训练自回归 Transformer,学习市场动态的时序依赖关系。

模型提供了四个不同规模的版本以适应不同的计算资源约束:Kronos-mini(4.1M 参数,上下文长度 2048)、Kronos-small(24.7M 参数)、Kronos-base(102.3M 参数)和 Kronos-large(499.2M 参数)。其中前三个版本已在 Hugging Face 开源,支持通过 KronosPredictor 类进行便捷的推理调用。

在推理阶段,用户只需提供包含历史 OHLCV 数据的 DataFrame 和目标预测时间戳,模型即可自动生成未来价格路径。predict 方法支持温度采样(temperature sampling)和核采样(nucleus sampling)等概率生成策略,允许控制预测结果的多样性。对于批量预测场景,predict_batch 方法利用 GPU 并行性同时处理多个时间序列,适合多资产组合分析。

零样本性能与领域泛化能力

Kronos 在多个金融预测任务上展现了强劲的零样本性能。在价格预测任务中,模型的 RankIC(排序信息系数)相比最强的通用 TSFM 提升了约 93%,相比非预训练基线提升了约 87%。在波动率预测任务中,平均绝对误差(MAE)降低了约 9%。在合成 K 线生成任务中,保真度指标提升了约 22%。

这些结果表明,领域专用的预训练策略能够有效捕捉金融市场的特有模式,而通用模型由于缺乏对价格约束、波动聚集等金融现象的先验建模,难以达到同等效果。值得注意的是,Kronos 的零样本能力意味着模型在未见过的市场或品种上也能产生合理的预测,这对于快速适应新上市资产或小众市场具有重要意义。

然而,零样本性能并不等同于生产级 Alpha。金融市场的非平稳性意味着历史模式可能在未来失效,特别是在极端市场条件下(如金融危机、黑天鹅事件)。因此,模型输出的信号需要经过严格的风险管理和组合优化才能转化为实际交易策略。

从演示信号到生产级 Alpha:工程化考量

Kronos 的微调流程展示了从基础模型到特定市场适配的完整路径。以 A 股市场为例,用户可以使用 Qlib 数据框架准备训练数据,通过两阶段微调(先调分词器、再调预测器)使模型适应本地市场的微观结构特征。微调后的模型可以生成价格变动预测信号,用于构建 Top-K 选股策略。

但在生产环境中,原始预测信号需要进一步处理才能形成稳健的投资组合。首先,需要通过风险因子中性化消除对市场贝塔、市值、价值等常见因子的暴露,提取 "纯 Alpha" 成分。其次,需要考虑交易成本、滑点和市场冲击,这些摩擦在回测中往往被低估。最后,动态仓位管理和止损止盈规则对于控制下行风险至关重要。

模型上下文长度的限制(512 或 2048 个 Token)也决定了单次可处理的历史窗口。对于高频策略,这可能对应几分钟到几小时的数据;对于低频策略,则需要通过特征工程压缩长期信息。用户需要在历史覆盖范围和预测粒度之间做出权衡。

总结与展望

Kronos 代表了时间序列基础模型向垂直领域深化的一次重要尝试。通过将金融 K 线数据 Token 化,模型成功地将自然语言处理中的自回归生成范式迁移到价格预测场景,并在零样本设置下取得了显著的性能优势。

对于量化从业者而言,Kronos 提供了一个可扩展的基础模型底座,支持快速适配特定市场或策略需求。但需要清醒认识到,模型输出的信号只是量化流程的起点,后续的因子加工、组合优化和风险管理才是决定策略实盘表现的关键。随着领域专用基础模型的持续发展,我们可以预期金融 AI 系统将从单一任务模型向多任务、多市场的统一建模框架演进。


资料来源

ai-systems

内容声明:本文无广告投放、无付费植入。

如有事实性问题,欢迎发送勘误至 i@hotdrydog.com