N-Day-Bench:基于真实代码库 CVE 的 LLM 漏洞检测评估框架
探讨 N-Day-Bench 如何通过真实代码库中的 CVE 实例评估 LLM 漏洞检测能力,填补基准测试与实际安全需求的工程缺口。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
探讨 N-Day-Bench 如何通过真实代码库中的 CVE 实例评估 LLM 漏洞检测能力,填补基准测试与实际安全需求的工程缺口。
深入解析 Encore 基于 Rust 的 TypeScript 运行时在内存管理、类型桥接与 JS 互操作方面的工程化挑战与核心设计决策。
探讨利用真实历史 CVE 数据构建 LLM 漏洞检测评估体系,填补现有基准与实际安全需求之间的工程缺口。
从代码特征到CI/CD流水线,详解WordPress插件供应链后门的工程化检测与自动化审计方案。
对比基于 Karpathy 观察的手动 CLAUDE.md 规则工程与 claude-mem 的自动上下文压缩实现,解析两种 LLM 编码助手优化路径的工程差异与适用场景。
从攻击方视角拆解 Essential Plugin 收购案的成本结构、目标选择逻辑、潜伏策略与回报率计算。
深入解析 AMD GAIA 开源框架的本地 AI Agent 运行时架构,聚焦边缘设备的 NPU/GPU 协同加速策略与隐私优先的部署方案。
深入解析B树索引在数据库存储引擎中的工程实现细节,提供可落地的性能调优参数与监控指标。
深入解析 Firefox 构建系统中并行编译的配置策略,通过依赖图分析与资源调度技巧实现构建效率的显著提升。
围绕CPU流水线可视化的工程实现,阐述数据hazard检测单元、转发逻辑与分支预测的硬件参数设计及性能监控要点。
解析开源托管代理平台 Multica 如何通过任务生命周期管理、实时进度流与技能累积机制,将 AI 代理转化为可协作的团队成员。
梳理近二十年重大供应链攻击事件的演进脉络,从 SolarWinds、Log4j 到 2025-2026 年高频攻击态势,提炼安全架构设计的核心原则与可落地参数。
聚焦持续卖出No头的单边做市策略,从金融工程角度分析寸头管理、对手方风险暴露、对冲成本计算与做市商返利优化路径。
深度剖析攻击者通过 Flippa 收购 30+ WordPress 插件并植入后门的供应链攻击手法,提取可落地的代码特征与检测参数。
详解如何通过 Polymarket CLOB API 构建自动化交易机器人,实现非体育市场过滤与 No 合约持续买入的完整工程方案。
深入解析开源 AI 对冲基金项目的多代理系统架构设计,涵盖 19 个专业化代理的角色分工、集中式状态管理与串并联混合的数据流编排模式。
解析 boringBar 作为任务栏风格 Dock 替代方案的技术选型,深度对比 NSStatusItem 与 NSDockTile 的工程实现差异及架构考量。
详解 LLVM RISC-V 后端性能回归的定位与修复流程,提供二分查找、回归测试与验证的完整工程参数。
解析 Cloudflare 统一 CLI 的设计思路与多工具整合工程实践,涵盖命令行参数标准化、子命令插件化与输出格式一致性等核心要素。
剖析 Claude Code 插件如何通过 5 个生命周期钩子实现会话上下文自动捕获,利用 AI 压缩后注入未来会话,突破上下文窗口限制。