用纯 Go 构建倒排索引与 BM25 排名及模糊查询
纯 Go 实现的全文搜索引擎,聚焦倒排索引、BM25 评分与模糊查询,提供高效 tokenization、posting lists 及工程化参数。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
纯 Go 实现的全文搜索引擎,聚焦倒排索引、BM25 评分与模糊查询,提供高效 tokenization、posting lists 及工程化参数。
探讨最小对抗样本如何嵌入触发器,分析小于0.1%注入比率下后门激活对LLM跨任务输出的退化,提供设计参数与缓解策略。
利用 WinApps 项目,通过 RDP 隧道和容器化 Windows VM,实现 Windows 应用在 Linux 桌面(如 GNOME/KDE)的原生集成,包括文件共享、剪贴板同步,提升生产力。
探讨 Python 3.14 的 JIT 改进在 CPU 密集任务中的表现,以及 I/O 操作和 Flask 等 Web 应用的实际速度提升,提供工程化参数和测试建议。
探讨用C语言实现轻量级异步Web服务器,焦点在事件循环、非阻塞I/O、高效路由、中间件链和零分配请求解析,以处理高并发。
Flowise 作为低代码平台,通过可视化拖拽节点实现 LLM 链路的快速构建、外部工具和 API 的无缝集成,以及 AI 代理的弹性部署,并配备运行时监控机制,确保生产级可靠性。
Goiaba 项目通过 Rust 实现 Go 解析器与编译器,提升前端工具的诊断准确性和错误恢复能力,提供工程参数与实现要点。
针对扫描 PDF、邮件和手写笔记,设计多模态 LLM 管道,通过 OCR 链和实体解析实现 95% 准确率,提供工程参数和监控要点。
面向跨平台 AI 代理,给出视觉模型驱动的屏幕解析与行动循环的工程化参数与监控要点。
面向 LLM 训练,给出相似性过滤和损失监控的工程化参数与防御策略。
针对 OpenAI Agents SDK 的多代理接管延迟问题,提供状态序列化优化和预测路由策略,实现实时协作工作流的低延迟工程实践。
探索如何使用 SurfSense 编排来自 Slack、Jira、GitHub 和 Discord 的实时数据流,实现 AI 驱动的项目监控、事件警报和跨工具自动化任务合成。提供配置参数、监控要点和落地清单。
利用 SurfSense 连接 Slack、Jira、GitHub 和 Discord,实现 AI 驱动的项目监控、事件警报和跨工具任务自动化。
本文探讨OpenAI Agents Python SDK在协调多代理AI系统中的应用,包括工具链实现、状态共享机制以及错误恢复策略,提供可落地的工程参数和最佳实践。
针对 IoT 部署中 100 个蓝牙信标的压力测试,提供电池管理、干扰抑制和碰撞解析的工程参数与最佳实践。
在ML训练集群中,使用Prometheus和Grafana构建实时GPU仪表盘,监控利用率、内存和温度,提供工程化参数和警报配置。
剖析 LLM 代理在模块化代码合成与集成测试中的崩溃点,提供针对依赖管理和边缘案例验证的专项提示策略。
探讨对比激活转向方法在表示工程中的应用,利用配对正负示例引导LLM激活,实现无重训的精确行为控制,包括工程参数与监控要点。
探讨Lavandula框架,利用事件循环实现异步请求处理、高效路由和中间件扩展,提供无外部依赖的工程化参数与监控要点。
探讨在 Go 语言中,通过重设计数据结构使用连续内存布局和减少指针使用,来优化 CPU 缓存利用率,实现相同算法下 10 倍性能加速的工程实践与参数配置。