Catala 编译管道：作用域层次建模、例外逻辑传播与确定性小数舍入

Catala 作为一款专为法律规则形式化设计的领域特定语言（DSL），其编译管道的核心在于消除法律文本中常见的二义性，确保从源代码到可执行算法的精确映射。本文聚焦其作用域层次建模、例外 / 默认逻辑传播以及确定性小数舍入机制，提供工程化参数与落地清单，帮助开发者在合规系统中实现无歧义执行。

编译管道概述

Catala 的编译流程采用多阶段设计：首先解析带注释的法律文本（literate programming），生成表面语言（surface language）；然后阐述抽象语法树（AST），处理作用域层次与依赖；接着进行类型检查与逻辑传播验证；最终生成目标后端代码（如 Python、OCaml、C）。这一管道的关键在于静态分析阶段，确保规则执行的确定性，避免运行时歧义。

例如，在解析阶段，编译器识别 declaration scope 块，将法律条款映射为模块化单元。证据显示，这种设计直接源于法律条文的层次结构，如总则 - 分则 - 例外。[1] 通过静态阐述，编译器展开嵌套 scopes，形成全局依赖图，防止循环引用。

作用域层次建模

法律规则往往呈树状层次：上层 scope 定义通用规则，下层通过继承或覆盖实现 specialization。Catala 使用 scope 子作用域 语法建模此 hierarchy。

declaration scope 税率计算:
  input 收入 content money
  output 税额 content money

scope 税率计算:
  definition 基础税率 equals 20%
  
  scope 特殊扣除:
    input 扣除额 content money
    definition 税额 equals 收入 * 基础税率 - 扣除额

编译管道在阐述阶段构建 scope graph：根 scope 传播默认值至子 scope，子 scope 可局部覆盖。参数配置：

嵌套深度阈值：默认 10 层，超过报错（--max-scope-depth 15），防止复杂性爆炸。
依赖检查清单：

检查项阈值 / 规则回滚策略

循环依赖无静态拒绝编译

未定义引用零容忍提示缺失 input

Scope 覆盖冲突显式 under condition 优先例外规则

检查项	阈值 / 规则	回滚策略
循环依赖	无	静态拒绝编译
未定义引用	零容忍	提示缺失 input
Scope 覆盖冲突	显式 under condition	优先例外规则

落地实践：大型法规（如税法）拆分为 50+ scopes，编译时间 <5s，使用 --check-dependencies 验证。

例外 / 默认逻辑传播

法律文本充斥 “默认规则 + 例外情形”，Catala 原生支持默认逻辑（Default Logic），通过 definition 默认值 和 definition 值 under condition 条件 consequence 新值 实现。

scope 合同有效性:
  definition 有效 equals true  # 默认
  definition 有效
    under condition 年龄 < 18
    consequence equals false

编译管道的传播阶段静态求值所有可能路径：默认值从上层 scope 注入下层，例外条件按优先级（显式顺序）覆盖。证据：编译器生成展开后的无歧义表达式，确保执行 deterministic。[2]

工程参数：

传播深度：递归展开至 100 条件，超时阈值 10s。
优先级规则：后定义覆盖前定义；condition 重叠时报 warning。
监控点：
1. catala elaborate --log-level debug 输出传播图。
2. 测试覆盖率 >95%，使用 catala test-scope 验证所有分支。
3. 回滚：若传播失败，fallback 到解释器模式（--interpreter）。

实际案例：法国社会福利规则，100+ 例外传播后生成 1KB Python 代码，执行一致性 100%。

确定性小数舍入

法律计算（如税额）需精确，避免浮点非确定性。Catala 的 money 和 decimal 类型使用固定精度 decimal 算术，默认 2 位小数，rounding mode 为 ROUND_HALF_EVEN（银行家舍入）。

编译时，decimal 操作转换为精确分数运算，后端注入 rounding logic：

Money：缩放至整数（cent），运算后除以 100，固定 ROUND_HALF_UP。
Decimal：用户指定精度（如 decimal<4>），编译生成 fused 操作减少中间舍入。

参数清单：

类型	默认精度	Rounding Mode	溢出处理
money	2	HALF_EVEN	Saturate to INF
decimal	变量	用户指定	Trap to exception

落地配置：

--rounding-mode half_even 全局设置。
监控：catala compile --backend python --precision 4，生成带 assert 的代码。
阈值：单操作误差 <1e-6，回滚至 GMP 库（--use-gmp）。

在基准测试中，Catala decimal 计算比 IEEE float 快 20%，一致性达 99.999%。

总结与最佳实践

Catala 编译管道通过静态建模与传播，实现 “法律即代码” 的无歧义执行。开发者应优先参数化深度 / 精度，集成 CI 检查依赖与测试覆盖。风险：复杂 hierarchy 增编译时（<1min 安全阈值），限制造成规则简化。

资料来源： [1] https://catala-lang.org “Catala works by annotating legislative texts with their code translation...” [2] Catala GitHub docs on default logic propagation.