Lowfat 可插拔 CLI 过滤器架构：在管道层实现 90%+ Token 压缩

AI 编程助手在处理 CLI 命令输出时面临一个共同困境：git diff、kubectl get 或 terraform plan 等命令产生的冗长输出往往包含大量对决策无关的噪音 —— 进度条、时间戳、元数据字段、空行和 ANSI 转义序列。这些噪音在传递给 LLM 时会迅速消耗上下文窗口并推高 API 成本。传统的解决方案如 Headroom 采用代理模式拦截请求，但 Lowfat 选择了一条截然不同的路径：通过可插拔过滤器架构直接嵌入 CLI 工具链，在 Unix 管道层完成智能压缩。

架构定位：管道集成 vs 代理拦截

Lowfat 的核心设计哲学体现在其架构分层中。与在应用层设置代理拦截请求的模式不同，Lowfat 作为轻量级 CLI 工具（Rust 实现，单二进制文件），直接介入命令执行流程：CLI 解析参数后，Runner 组件执行真实命令，随后通过 HybridRunner 加载插件并遍历流水线阶段，最终输出经过滤的内容并记录指标到本地 SQLite。这种设计的优势在于零网络延迟、无外部依赖，且完全本地运行（无遥测）。

集成方式体现了其灵活性：Claude Code 用户可通过 PreToolUse hook 在工具调用前自动触发过滤；Shell 用户可通过 eval "$(lowfat shell-init zsh)" 实现透明拦截；OpenCode 和 Pi agent 也有对应的插件或配置支持。无论哪种方式，命令输出在到达 AI 代理前都经过了一道可定制的过滤器链。

三级压缩策略与 lf-filter DSL

Lowfat 的压缩策略分为三个级别，对应不同的信息密度需求。ultra 级别追求极致压缩，仅保留判决性信息（如错误摘要、关键状态行）；full 级别在去除进度噪音的同时保留差异、错误和结构信息；lite 级别则进行轻度修剪，保留更多上下文。当命令返回非零退出码时，系统默认采用保守策略（if exit failed: raw），确保错误信息完整传递。

插件系统支持两种格式：声明式的 .lf 文件和传统的 .sh shell 脚本。其中 lf-filter DSL 是 Lowfat 的核心创新，它通过 define 宏和 rule 规则块实现可组合的过滤逻辑。规则采用 "首个匹配获胜" 的选择器机制，支持子命令匹配（如 status:、build|check:）和通配符（*:）。

内置操作符覆盖常见过滤需求：keep /regex/ 和 drop /regex/ 基于正则保留或删除行；head N 和 tail N 限制输出行数（支持 auto 根据级别自动缩放）；or "text" 在输出为空时提供兜底内容；split /regex/ 则支持在首条匹配行处分割输入，对前后部分分别处理。对于无法通过内置操作符表达的逻辑，系统提供 shell: 和 python: 两种转义机制，后者支持 PEP 723 内联脚本依赖声明，通过 uv 实现环境自动管理。

插件开发实践

开发一个 Lowfat 插件始于 lowfat plugin new <name> 命令，该命令会在 ~/.lowfat/plugins/ 下生成标准目录结构：包含清单文件 lowfat.toml、规则文件 filter.lf 和用于测试的 samples/ 目录。清单文件声明插件名称、匹配的命令及子命令列表，以及可选的二进制映射（处理别名情况）。

以 git-compact 插件为例，它展示了 DSL 的表达能力：针对 diff 子命令，根据级别和退出码采用级联策略 —— 出错时原样输出，ultra 级别调用 compact-diff 30 宏并兜底 50 行非空行，lite 级别放宽到 400 行。compact-diff 宏内部通过 awk 脚本实现差异块的智能截断，保留文件头和 hunk 头，在 ultra 级别甚至进一步截断行内信息。这种声明式与命令式混合的风格，既保证了常见场景的性能（内置操作符纯 Rust 实现，无子进程开销），又为复杂逻辑保留了扩展性。

对于 kubectl get -o yaml 这类输出，正则表达式难以安全处理（注解可能包含任意字符包括 ---），此时 python: 转义配合 PyYAML 成为更可靠的选择。插件可以递归修剪 managedFields、resourceVersion 等服务器端字段，将注解对象折叠为条目计数，实现结构化的深度压缩。

集成配置与监控

Lowfat 提供多级配置机制：环境变量（如 LOWFAT_LEVEL）用于临时覆盖；.lowfat TOML 文件定义命令级别的流水线（如 pipeline.kubectl = strip-ansi | kubectl-compact | truncate:100）；插件清单则声明前置 / 后置处理器。这种分层设计允许用户在不同粒度上定制行为。

工具内置的监控能力同样实用：lowfat stats 展示生命周期内的 token 节省统计；lowfat history 按潜在节省潜力排序历史命令，指导用户优先为高频高噪音命令开发插件；lowfat plugin bench 则通过样本对比验证压缩效果（目标是在 noisy 命令上达到 80%+ 的节省率）。lowfat filter --explain 命令可逐阶段展示行数、字节数和 token 数的变化，为调优提供量化依据。

权衡与局限

可插拔架构的优势在于性能（无代理层开销）和隐私（数据不离开本机），但其代价是插件的命令特异性。每个命令族（git、kubectl、terraform）通常需要专门的插件和领域知识来识别噪音与信号的边界。此外，过度激进的压缩（尤其 ultra 级别）可能导致上下文丢失，影响 AI 的决策质量。建议生产环境从 full 级别开始，配合 lowfat stats --audit 持续验证，仅在确认安全后才对特定子命令启用 ultra。

资料来源

GitHub: zdk/lowfat - 项目仓库与文档
Lowfat Architecture 文档 - 架构图与组件说明
Lowfat Plugins 文档 - lf-filter DSL 规范与开发指南

ai-systems

内容声明：本文无广告投放、无付费植入。

如有事实性问题，欢迎发送勘误至 i@hotdrydog.com。