使用 garak 构建模块化红队测试管道:LLM 漏洞探测与安全部署
面向 LLM 安全工程,探讨 garak 工具的插件式红队管道构建,实现提示注入、偏见和幻觉检测,支持多模型评估与自动化报告。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
面向 LLM 安全工程,探讨 garak 工具的插件式红队管道构建,实现提示注入、偏见和幻觉检测,支持多模型评估与自动化报告。
针对开源双足人形机器人 ToddlerBot,阐述模块化 Dynamixel 伺服执行器的集成、3D 打印底盘的设计参数,以及 ROS2 控制栈的节点架构与配置,实现基本步行与操纵任务。
探讨在Claude中构建持久键值内存系统,实现跨会话AI交互,与GPT的短暂上下文窗口形成对比,提供工程参数和最佳实践。
针对 PostgreSQL 在 Debian 13 中的美国时区处理,提供 zoneinfo 二进制解析、规则继承优化及 POSIX 转换策略,以修复 DST 查询失败和时钟变化中断。
通过 ROMA 框架工程化递归元代理,强调状态持久化、工具编排及任务分解的性能优化。
基于 Go 的 Nightingale 监控系统,提供自定义告警、多租户仪表盘、Prometheus 集成及零停机集群的工程实践与参数配置。
针对 AI 检索系统,探讨 Milvus 的云原生分片策略、IVF-PQ 与 HNSW 混合索引参数优化,以及实时数据摄取配置,确保亿级向量的高性能 ANN 搜索。
探讨工程化语义差异比较和提交祖先追踪技术,检测SWE-bench基准中的微妙Git历史泄漏,通过自动化数据集清洗管道确保LLM编码基准的公平性。
探讨 Spiral DB 中稀疏索引的工程实践,实现亚线性向量相似性搜索,支持自动分片和实时更新,提供参数配置与监控要点。
面向社交推荐系统,探讨 TW HIN 知识图谱嵌入、Finagle RPC 协调及重排名启发式在 Scala 中的工程优化,实现低延迟候选生成。
针对 curl C 代码库的长期维护,探讨自动化模糊测试管道、依赖审计流程、贡献者入驻机制以及内存安全改进策略,提供工程化参数与监控要点。
探讨 HeroUI 如何通过令牌驱动主题、原子组件设计、React 高效渲染、Framer Motion 动画以及 Figma 无缝集成,实现高性能、可扩展的 Web 应用。
探讨如何用 TypeScript 工程化一个终端 CLI,支持 AI 驱动代码生成,重点关注提示链机制、语法验证流程,以及与本地 LLM 的集成,实现离线原型开发。
通过 garak 的插件架构,扩展自定义探测器针对提示注入、偏见和越狱,实现高效的 LLM 红队测试。
基于 Zig 的 Jetzig 框架,通过自定义事件循环和零拷贝解析技术,实现高吞吐量异步 HTTP 路由中间件,达到子毫秒响应时间。
面向高性能 web 服务,给出在 Zig 的 Jetzig 框架中实现异步路由、中间件、零分配解析和编译时路由验证的工程实践与参数配置。
基于 Qwen3-Next 的 MoE 架构,探讨 kernel fusion 和混合精度 ops 的多 GPU 优化策略,实现高效训练与亚秒级推理。
利用 TwHIN 图嵌入、Finagle RPC 和重排名模型,在 Scala 中实现亚 100ms 的实时候选生成,支持可扩展的个性化推荐。
针对 curl 25 年 C 代码库,介绍自动化依赖扫描、贡献者工作流与安全补丁管道的工程实践,确保兼容性与实时漏洞响应。
探讨 Stal/IX 如何借鉴微内核设计,通过能力-based 安全、消息传递 IPC 和用户空间驱动实现增强隔离,与传统单体内核 Linux 对比,提供工程参数和实施要点。