基于 WAL 文件轮询实现 SQLite 的 Postgres 风格通知机制

在现代应用架构中，数据库事件驱动通信已成为构建实时系统的核心能力。PostgreSQL 提供的 LISTEN/NOTIFY 机制因其简洁的发布订阅语义而广受好评，但当项目选择 SQLite 作为主数据存储时，开发者往往面临通知能力缺失的困境。honker 项目通过一种巧妙的 WAL 文件轮询机制，在不修改 SQLite 内核的前提下，为 SQLite 带来了完整的 Postgres 风格通知支持。

核心设计思路：WAL 文件作为变更信号

SQLite 的预写日志（WAL）模式是其支持并发读写的关键机制。在 WAL 模式下，每一次事务提交都会向 .db-wal 文件追加新数据，这意味着该文件的 size 和 mtime 会发生可观测的变化。honker 正是利用这一特性，将 WAL 文件的状态变更作为跨进程的事件触发器。当一个进程向数据库写入数据后，其他进程可以通过检测 WAL 文件的变化来感知到新的提交。

这种设计规避了 SQLite 本身缺乏内置通知机制的根本限制。传统方案通常依赖定时轮询数据库表来检测变化，这会带来不可忽视的延迟和资源浪费。honker 的方案将检测精度提升到毫秒级别，同时保持了极低的 CPU 开销。WAL 文件的物理属性变化提供了无状态的全局信号，任何监听该数据库文件的进程都能接收到相同的事件通知。

实现细节：stat (2) 轮询与通道分发

honker 的核心技术实现建立在一个高性能的轮询循环之上。每个 Database 实例启动一个独立的 stat 线程，以 1 毫秒的间隔检测 WAL 文件的 size 和 mtime 变化。当检测到变化时，该线程会向所有已注册的订阅者广播一个 tick 信号。这一机制的设计哲学是将唤醒逻辑与业务逻辑分离：stat 线程负责高效地检测变化，而具体的业务处理则由各个订阅者的回调函数执行。

每个订阅者通过一个受限的同步通道（bounded SyncSender）连接到轮询线程。当收到 tick 信号时，订阅者执行一次 SELECT 查询，从对应的表中获取自上次处理以来的新行。这种设计确保了即使有大量订阅者，每个订阅者也只在收到明确信号时才执行数据库查询，避免了无效的轮询开销。值得注意的是，honker 选择了跨平台兼容的 stat (2) 系统调用而非特定操作系统的文件监控 API（如 Linux 的 inotify 或 macOS 的 FSEvents），原因是 FSEvents 在 macOS 上会丢失同一进程内的文件写入事件，而在某些嵌入式场景中内核级通知可能不可用。stat (2) 虽然在理论上有约 0.5 毫秒的额外延迟，但其行为在所有主流平台上完全一致。

三种原语：notify、stream 与 queue

honker 提供了三个层次的数据库通信原语，分别对应不同的使用场景。notify 是最轻量的临时通知机制，类似于 Postgres 的 NOTIFY/LISTEN，它将通知存储在 _honker_notifications 表中，但不会自动清理历史记录，适用于需要即时推送但不需要持久化的场景。stream 则提供了持久的发布订阅能力，每个命名消费者维护自己的消费偏移量，即使消费者离线期间产生的事件也能在重新上线后回放，这类似于消息队列的 at-least-once 语义。queue 是最完整的工作队列实现，支持任务认领、重试机制、死信队列和优先级调度。

这三种原语的共同特点是它们都遵循事务性出队模式（transactional outbox pattern）。当用户在业务事务中调用 notify、enqueue 或 publish 时，这些操作实际上是向相关表中插入行的 SQL 操作，它们与用户的事务绑定在一起。如果事务回滚，通知或任务也会随之消失；如果事务提交，通知或任务立即对所有监听者可见。这种设计从根本上消除了分布式系统中常见的数据一致性问题，不需要额外部署消息队列或调度器。

性能表现与工程权衡

根据官方基准测试，honker 在现代笔记本硬件上能够处理每秒数千条消息，跨进程唤醒延迟的中位数约为 1 到 2 毫秒。这一性能水平足以满足绝大多数 Web 应用的实时需求。WAL 模式下的自动检查点策略（默认为每 10000 页执行一次）进一步优化了写入吞吐量，将 fsync 调用的频率控制在合理范围内。

当然，这种设计也存在明确的适用范围约束。首先，SQLite 本身只支持单主机写入，多台服务器共享同一个数据库文件会导致数据损坏，因此 honker 适用于单机部署场景。其次，WAL 文件轮询本质上是一种启发式检测机制，它能够告知使用者「有变化发生」，但无法精确描述变化的具体内容，使用者仍需主动查询才能获取最新数据。最后，临时通知（notify）不会自动过期清理，生产环境需要定期调用 prune_notifications 来管理存储空间。

工程实践建议

在实际项目中集成 honker 时，有几个关键参数值得特别关注。visibility_timeout_s 控制任务在认领后的可见性超时时间，默认 300 秒，这意味着如果工作进程在处理任务时崩溃，任务会在 5 分钟后重新变为可认领状态。max_attempts 控制任务的最大重试次数，超过后任务会移入死信表。stream 的偏移量保存间隔默认为每 1000 条消息或每秒钟一次，高吞吐场景下可以适当调整以减少数据库写入次数。

对于需要构建实时 Web 应用的团队，honker 提供了一种优雅的解决方案：将消息队列、工作队列和调度器的功能整合到单一的 SQLite 文件中，避免了引入 Redis、Celery 等额外依赖。对于已经在使用 SQLite 的项目，这种轻量级的通知扩展能够在几乎不增加运维复杂度的前提下，实现与 Postgres 生态相当的实时数据流处理能力。

资料来源：本技术解析基于 honker 官方 GitHub 仓库（https://github.com/russellromney/honker）的项目文档与设计说明。

systems