Llama 3.1 70B单卡推理的PCIe P2P传输:CPU旁路工程实现
深入解析通过NVMe PCIe直连GPU绕过CPU的内存拷贝优化,实现单RTX 3090运行70B模型的PCIe P2P传输工程细节。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
深入解析通过NVMe PCIe直连GPU绕过CPU的内存拷贝优化,实现单RTX 3090运行70B模型的PCIe P2P传输工程细节。
对比两种过滤器在删除支持、空间效率上的核心差异,给出动态数据集场景下的负载因子、插入失败率监控与扩容策略的工程参数建议。
从工程视角解析密码学实现中的常见缺陷模式,提供可操作的审计检查清单与具体参数阈值。
基于公开工具构建浮世绘版画相似图像检索系统,涵盖CNN特征提取、FAISS向量索引与文化元数据关联的完整工程参数。
深入解析通过 Telegram Bot 远程调用 Claude Code 的工程实现,涵盖会话持久化、认证机制、目录沙盒与事件驱动自动化等核心技术细节。
分析Kimwolf僵尸网络如何通过700k节点大规模注入导致I2P网络层瘫痪,揭示去中心化 anonymity network 面对资源耗尽攻击的脆弱性及容灾关键参数。
工程化分析历史英语文本可读性阈值:基于语料库的语言演变度量与可理解性算法,量化 300 年可读性分界点与参数阈值。
解析 PentAGI 等 AI 渗透测试系统的任务分解机制,聚焦分解式越狱、上下文碎片化等安全风险,给出作用域控制与编排层安全策略。
深入解析 Hands-On Large Language Models 代码仓库的 Notebook 组织形式与教学设计原则,为教育性代码仓库提供可复用的架构参考。
深度解析 Cloudflare Workers 平台上构建 AI Agent 的开发框架,聚焦 Durable Objects 有状态编排与工具绑定的工程实现参数。
解析企业AI基础设施部署面临的多维挑战:技术复杂度、遗留系统集成、ROI验证周期长,以及组织惯性如何共同导致采用率低于预期。
从工程视角分析 AI 代理如何主导网络发现过程,导致开放互联网对人类访问者日益不透明,并给出零可见性架构的设计原则与关键参数。
通过在单 uint32 中存储两位计数信息,将布隆过滤器误判率从 11.68% 降至 5.69%,实现 2 倍精度提升的工程实现与关键参数。
深入解析 Palantir Ontology 作为决策中枢知识图谱的核心架构,探讨其实体建模方法、关系推理机制与异构数据融合的工程实现路径。
在 CLI 代理中分离规划与执行阶段,通过 Plan Mode 与人工确认机制降低 LLM 自主操作的风险与 token 消耗。
分析 2026 年 2 月 Kimwolf 僵尸网络意外冲击 I2P 网络的技术根因,探讨 Sybil 攻击下流量清洗机制失效、路由表污染与节点信任链断裂的工程教训。
以canvas_ity为例,分析单头文件C++库的现代实现技术,涵盖梯形区域抗锯齿、伽马校正混合、模板元编程等核心技术要点。
深度解析时间维度误差前向传播的数学机制,区别于传统反向传播的时间链误差建模方法,给出控制系统工程实现的关键参数与监控要点。
深度剖析AI代理误操作时的法律责任划分,从EU产品责任指令到ISO 42001治理框架,并给出工程实践参数与保险配置建议。
F-Droid 联合开源生态发起「Keep Android Open」运动,反对抗 Google 开发者验证新规,分析政策对侧载生态的影响及工程实践层面的应对策略。