纯本地 CLI 文档搜索引擎 QMD:混合检索架构与工程实践
深入解析 QMD 的混合检索管道:BM25 向量融合、LLM 重排序与位置感知混合策略,提供本地文档搜索的工程化配置参数。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
深入解析 QMD 的混合检索管道:BM25 向量融合、LLM 重排序与位置感知混合策略,提供本地文档搜索的工程化配置参数。
深入解析 LLM 爬虫 bot 大规模请求导致 HTTPS 服务器 TLS 握手过载的防御策略,提供边缘终止、连接限流、HAProxy 与 Nginx 配置清单。
深入探讨多角色 AI 应用中的人格状态管理、记忆隔离与上下文一致性保障的工程化实现方案。
深入探讨多角色 AI 应用中的人格状态管理、记忆隔离与上下文一致性保障的工程化实现方案。
解析 Anthropic Project Glasswing 的技术定位与核心工程实践,探索 AI 时代软件安全的新范式。
解析 Google 开源的 LiteRT-LM C++ 推理运行时架构与边缘部署优化路径,提供可落地的工程参数与监控要点。
深入解析 Linebender 推出的实验性 Rust 原生 UI 框架 Xilem,探讨其分层架构设计与响应式数据流模型,对比传统 GUI 库的差异化选择。
深入解析 GLM-5.1 在超长上下文窗口下的技术实现,探讨其 8 小时长程任务处理能力的工程细节与优化策略。
深入解析 Google 开源的 Scion 多智能体编排测试床,探讨其容器化隔离、并行执行与工程化测试方法。
在 Apple Silicon 本地运行 Gemma 4 多模态微调,聚焦 MLX 框架适配与内存优化工程参数,提供可落地的配置建议。
通过浏览器内嵌 Linux 虚拟机与 WebUSB/USB/IP 桥接技术,恢复旧打印机生机的工程化实践。
深入解析多租户场景下 LoRA 适配器的动态加载架构,提供可落地的权重管理策略与显存优化参数。
深入解析 GitNexus 如何在浏览器中通过 Tree-sitter WASM 与图数据库实现零服务器的代码知识图谱构建,并构建可交互的 Graph RAG 智能体。
深入解析 Google 推出的 JSIR 如何利用 MLIR 框架实现 JavaScript 源码的高保真往返,并探讨其在反编译与去混淆场景的工程实践。
解析 Cloudflare 后量子密码迁移路线图的核心里程碑、关键技术组件与实施过程中的工程难题,为安全团队提供可操作的迁移参数。
深入解析 Agent Reading Test 基准测试的 10 种内容读取失败模式,提供工程团队可量化的评估参数与监控阈值。
深度剖析恶意 Shader 在编译链路中的资源消耗、验证器绕过与沙箱逃逸威胁,并给出可落地的工程防护参数与监控阈值。
解析SCTP多宿主与路径切换机制,给出云原生环境下跨可用区容灾的关键参数配置与监控策略。
解析 bcachefs 的写前日志(WAL)架构、journal 持久化策略与崩溃后的 B-tree 恢复流程,对比 btrfs 的 COW 机制差异。
聚焦SMPP协议会话层的指数退避重连机制、绑定状态恢复与运营商网关超时处理的工程化参数与监控要点。