Lemonade本地LLM延迟基准测试:GPU与NPU异构计算的量化性能对比
基于Lemonade Server在AMD Ryzen AI平台上的延迟基准测试,提供GPU/NPU异构调度策略的token/s性能实测对比与工程调优参数。
Latest Essays
继续沿着时间线阅读近期的工程实践与技术观察。
近期的思考与工程笔记。
基于Lemonade Server在AMD Ryzen AI平台上的延迟基准测试,提供GPU/NPU异构调度策略的token/s性能实测对比与工程调优参数。
深入解析Memo编程语言仅保留最近12行代码的有限状态设计,探讨其对调试、REPL工程与程序验证的独特价值,并给出可落地工程参数。
基于前 Azure 核心工程师第一手经历,剖析云服务商信任 erosion 的工程化根源与风险缓解策略。
深入解析 oh-my-codex 如何为 Claude Code 提供自定义钩子、Agent 团队协作与 HUD 界面扩展的工程实现。
基于foxing项目解析eBPF内核事件捕获与异步回放机制,提供生产环境部署的参数配置与一致性保障方案。
解析 ReXGlue 静态重编译管线,揭示 PowerPC 指令到 x86-64 本地代码的映射机制、字节序处理与运行时函数分发表。
解析基于 Go 实现的 Yggdrasil Network 如何用树状路由与 Bloom Filter 构建自组织全网状 VPN,及其 IPv6 Overlay 架构的工程细节。
从 system_prompts_leaks 项目分析主流 LLM 系统提示词的提取方法,评估当前 Prompt 保护机制的有效性边界。
深入分析 Sherlock 项目的 Python asyncio 并发模型,探讨大规模用户名枚举中的速率限制规避、代理轮换与网站指纹识别工程实现。
深度解析 JSON Canvas 规范的结构化模式验证机制,提供解析器实现的工程参数与性能优化建议。
基于 Tailscale v1.88+ 窗口化 UI 新架构,深入讲解家庭多设备安全连接的 ACL 策略、子网路由与监控阈值。
解析 Cursor 3 在 IDE 环境下的上下文管理架构,探讨三 tier 模型、分层剪枝策略与工程化边界控制参数。
解析 Cursor 在 IDE 环境下的上下文管理架构,探讨三 tier 模型、分层剪枝策略与工程化边界控制参数。
从 LuminaLang 编译器架构出发,解析新型类型推导引擎的中间表示设计与多轮微 pass 工程化优化路径。
深入解析Gemma 4系列的推理延迟优化技术,提供INT4/AWQ量化策略、TensorRT-LLM内核配置及本地部署性能调优参数。
基于主流大模型泄露的system prompt分析防御机制,构建可落地的prompt注入检测规则库与红队测试用例。
深度解析 LinkedIn 浏览器指纹采集的技术实现机制,包括 Canvas 指纹渲染、硬件特征识别与第三方数据流向。
通过实测对比自研 DNS 解析器与 trust-dns 库在 UDP/TCP 查询延迟、缓存命中率与吞吐量上的表现差异,并给出工程化落地的关键参数阈值。
深度解析 Bun 如何通过 JavaScriptCore 引擎与内置工具链实现百倍性能提升,并给出可落地的基准测试参数与选型决策清单。
不依赖任何外部 DNS 库,手写 RFC 1035 协议解析、域名压缩与 UDP 递归查询,提供可直接落地的工程参数与核心代码模式。