Gibberifier:注入隐形Unicode扰乱LLM Tokenizer的工程实践
利用Gibberifier工具注入零宽度Unicode字符组合,针对LLM tokenizer实现token爆炸与输出崩溃,提供工程阈值调优、检测绕过与防护清单。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
利用Gibberifier工具注入零宽度Unicode字符组合,针对LLM tokenizer实现token爆炸与输出崩溃,提供工程阈值调优、检测绕过与防护清单。
基于Google ADK-Go的code-first框架,给出AI代理评估基准配置、用户模拟测试清单,以及多代理部署的工程参数。
面向 LLM/AI 代理构建开源记忆引擎:分层存储、跨多代理同步、高效检索与长期上下文持久化参数配置。
全员一周 Fixit 周实践:停止 roadmap,聚焦小 Bug 修复,提升系统可靠性而不引入新功能。
像素级重现旧金山轻轨显示点阵字体Fran Sans,优化度量、字距调整及现代网页渲染,支持动画与交互效果的工程参数与实践。
从Cloudflare宕机提炼配置传播风险,提供校验阈值、回滚参数与监控清单,实现分布式系统可靠性主动强化。
基于MCP协议的多平台(35+)热点聚合管道,集成13种AI对话分析工具,支持Docker一键部署与多渠道推送的关键参数与工程化清单。
rTorrent 利用 libtorrent 库实现高吞吐量多连接下载,提供带宽节流和会话持久化配置参数,适用于服务器端高效 torrent 处理。
详解 RuBee (IEEE 1902.1) 在恶劣环境下的无电池 LF 标签双向协议设计、关键参数与 RTLS 部署清单。
聚焦 B-Tree 节点分裂/合并机制与扇出-高度 trade-off,给出数据库如 RocksDB/PostgreSQL 的工程化参数配置。
剖析根区密钥签名密钥(KSK)仪式的高安全设计,包括气隙环境、智能卡阈值解锁、防篡改封条及多方协作协议,提供工程化参数与监控要点。
基于Rust性能书籍,实现MIR内联、循环拆分、缓存感知数据布局,并用cargo-flamegraph剖析低延迟服务性能要点。
集成低开销 Vulkan/CUDA API hooks 到 Tracy,实现 GPU zone sampling、帧捕获与同步最小化,提供参数配置与监控要点。
LightRAG通过实体关系图构建和双层检索(local/global),实现低成本、高效RAG,支持增量更新与多存储,无需复杂索引。
LightRAG 通过双图边蒸馏融合实体与关系图,实现高效检索增强生成。详解提取去重、双层检索参数及工程化参数清单。
针对 Rust 借用检查器在所有权、生命周期、同步原语及并发模型方面的局限性,提供工程化规避策略、阈值参数与最佳实践清单,帮助构建高性能安全系统。
NVM 作为 POSIX bash 脚本,实现多 Node 版本管理,支持 .nvmrc 自动切换、二进制缓存与安装钩子,确保跨项目 reproducible 环境。
Cloudflare 通过边缘观测发现 CG-NAT 用户高延迟丢包,建立 ISP 限速指纹,提供多链路聚合与隧道 bypass 的工程参数,实现带宽公平保障。
剖析 Rust 借用检查器在 async trait 上的局限,包括 pinning 开销、借用冲突及 coherence 规则失败,提供无 workaround 的高效并发参数与监控清单。
面向大型代码库的 AI 自动补全,给出推测解码参数、多模型路由与 1M token 上下文管理的工程化实践。