# Hotdry Blog

> 代码、系统与工程实践的长期写作记录，适合按文章、分类和归档路径持续检索。

## 页面摘要
- 路径: /page/817/
- 当前页: 817 / 843
- 每页文章数: 20
- 文章总数: 16860
- 分类数: 267
- 归档年份数: 4
- 归档月份数: 17

## 快速导航
- [分类索引](/categories/)
- [归档索引](/archive/)
- [关于](/about/)
- [RSS](/rss.xml)

## 本页文章
### [使用 FlashAttention 内核实现高效线性注意力模型](/posts/2025/09/13/implementing-efficient-linear-attention-with-flashattention-kernels/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Flash Linear Attention 库，探讨优化内核在 Transformer 长序列处理中的应用，提供安装与配置指南。

### [使用 FlashAttention 内核实现高效线性注意力：O(n) 长序列 Transformer 训练与推理优化](/posts/2025/09/13/implementing-efficient-linear-attention-with-flashattention-kernels-for-on-long-sequence-transformers/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Flash Linear Attention 库，探讨如何在 GPU 上实现 O(n) 复杂度线性注意力机制，支持多种 SOTA 模型的快速训练和推理。

### [实现 Java 25 的异步 CPU 时间分析器：JFR 集成与火焰图可视化](/posts/2025/09/13/implementing-java-25-async-cpu-time-profiler-jfr-flame-graphs/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [compiler-design](/categories/compiler-design/)
- 摘要: 探讨 Java 25 中低开销 CPU 分析，利用 JFR 集成和火焰图可视化高效分析多线程应用瓶颈。

### [使用Flash Linear Attention的高效内核实现线性注意力模型](/posts/2025/09/13/implementing-linear-attention-models-with-flash-linear-attention-efficient-kernels/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于Triton优化的Flash Linear Attention内核，帮助Transformer处理长序列，降低内存开销，提供安装与调优指南。

### [实现 Plan 9 启发的 Web OS：虚拟命名空间与联合文件系统](/posts/2025/09/13/implementing-plan9-inspired-web-os-virtual-namespaces-union-file-systems/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [application-security](/categories/application-security/)
- 摘要: 基于浏览器实现 Plan 9 风格的 Web OS，利用虚拟命名空间和联合文件系统，支持无服务器状态的分布式应用托管。

### [SkiftOS 中使用 C/C++ 实现可移植多架构引导加载器：ARM、x86 和 RISC-V 的统一引导过程与硬件抽象](/posts/2025/09/13/implementing-portable-multi-arch-bootloader-skiftos-arm-x86-risc-v/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 面向 ARM、x86 和 RISC-V，SkiftOS 的多架构引导加载器设计，涵盖统一引导、硬件抽象和错误恢复序列的工程实践。

### [在Aris中实现安全的自适应响应生成：儿童教育的安全AI助手](/posts/2025/09/13/implementing-safe-adaptive-responses-in-aris-for-child-education/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何在Aris AI中使用过滤LLM、互动测验和家长控制来生成安全、适应性的响应，确保儿童教育无害且引人入胜。

### [使用 PyTorch DDP 实现可扩展分布式 ML 训练：EPFL 课程实验洞见](/posts/2025/09/13/implementing-scalable-distributed-ml-training-pytorch-ddp-epfl/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [ai-engineering](/categories/ai-engineering/)
- 摘要: 基于 EPFL 机器学习课程实验，探讨 PyTorch DDP 的数据并行、多 GPU 同步和容错梯度聚合的最佳实践与工程参数。

### [Claude 子代理的任务分解与并发执行：并行化复杂代码开发工作流](/posts/2025/09/13/implementing-task-decomposition-and-concurrent-execution-in-claude-subagents-for-parallel-code-development/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 使用Claude子代理实现任务分解和并发执行，以优化复杂代码开发工作流的管理与共享状态。

### [UTF-8 可变长度编码在字符串处理管道中的实现与验证](/posts/2025/09/13/implementing-utf8-variable-length-encoding-validation-string-pipelines/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 探讨 UTF-8 的可变长度编码设计及其在字符串处理管道中的实现，提供国际化支持和错误恢复解析的实用参数与清单。

### [在网络文件系统中集成 dm-cache 实现 SSD 分层加速：缓存一致性、预取启发式与带宽优化](/posts/2025/09/13/integrate-dm-cache-ssd-network-file-systems/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 通过 device-mapper 的 dm-cache 在 NFS 等网络文件系统中引入 SSD 缓存，分析缓存一致性维护、预取策略及带宽降低的工程参数与实践。

### [Chatbox 中集成本地 LLM：离线推理与多模型无缝切换](/posts/2025/09/13/integrating-local-llms-chatbox-offline-multi-model/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 Chatbox 集成 Ollama 等本地 LLM，实现跨平台离线 AI 聊天，支持多模型切换与 UI 优化。

### [Integrating Multiple AI Models in Genkit: Code Patterns with Observability](/posts/2025/09/13/integrating-multiple-ai-models-in-genkit-code-patterns-with-observability/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Using Genkit to integrate various AI models and platforms, leveraging code-centric patterns and built-in observability for scalable development.

### [Kefir：独立实现的C17/C23编译器验证与工程实践](/posts/2025/09/13/kefir-c17-c23-compiler-validation/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [compiler-design](/categories/compiler-design/)
- 摘要: 探讨Kefir编译器如何通过solo开发实现C17/C23标准合规，包括AST解析、广泛验证套件以及生成可移植二进制文件的代码生成策略。

### [通过 Kyverno CRD 实现 Kubernetes 策略准入控制：动态生成网络策略](/posts/2025/09/13/kyverno-policy-admission-control-dynamic-network-policies/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [ai-security](/categories/ai-security/)
- 摘要: 利用 Kyverno 的 CRD 机制，通过 validate、mutate 和 generate 规则实现资源变异、配置验证以及无代理动态网络策略生成，确保 Kubernetes 集群安全合规。

### [Vectroid 中亿级向量内存高效索引：48MB 紧凑结构](/posts/2025/09/13/memory-efficient-billion-vector-indexing-vectroid/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Vectroid 如何使用紧凑结构在 48MB 内索引 1B 向量，实现资源受限 AI 系统的快速 ANN 搜索。

### [使用 Motia 构建可扩展后端：统一 API、作业和工作流与 AI 代理](/posts/2025/09/13/motia-unified-backend-framework/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探索 Motia 框架如何通过单一 Step 原语统一后端组件，实现高效的 AI 代理编排与可观察性。

### [Optimize Protobuf Wire Format for Low-Latency Serialization in Distributed Systems: Handling Schema Evolution and Unknown Fields](/posts/2025/09/13/optimize-protobuf-wire-format-low-latency-serialization-in-distributed-systems-handling-schema-evolution-and-unknown-fields/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: Explore strategies to optimize Protobuf's wire format for minimal serialization latency in distributed environments, while maintaining compatibility through schema evolution and u…

### [用 wcwidth-o1 优化 JS/TS 终端 Unicode 单元宽度计算：O(1) 处理双宽字符与组合标记](/posts/2025/09/13/optimize-unicode-cell-width-in-js-ts-terminals-with-wcwidth-o1/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 在 JS/TS 终端渲染中，使用 wcwidth-o1 实现 O(1) Unicode 字符宽度计算，支持双宽 CJK 字符和组合标记，避免全字符串迭代。提供集成参数、监控要点和优化清单。

### [优化VaultGemma在边缘设备上的低延迟差分隐私推理](/posts/2025/09/13/optimize-vaultgemma-dp-inference-edge/)
- 日期: 2025-09-13T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对VaultGemma模型，探讨量化差分隐私机制与安全聚合技术，实现边缘设备实时隐私保护LLM服务，提供工程化参数与监控要点。

## 热门分类
- [ai-systems](/categories/ai-systems/): 5960 篇
- [systems-engineering](/categories/systems-engineering/): 4056 篇
- [systems](/categories/systems/): 1860 篇
- [ai-security](/categories/ai-security/): 868 篇
- [application-security](/categories/application-security/): 842 篇
- [compiler-design](/categories/compiler-design/): 699 篇
- [security](/categories/security/): 526 篇
- [ai-engineering](/categories/ai-engineering/): 329 篇
- [compilers](/categories/compilers/): 322 篇
- [web](/categories/web/): 205 篇
- [general](/categories/general/): 198 篇
- [mlops](/categories/mlops/): 81 篇

## 最近归档
### [2026 年](/archive/2026/)
- 年度文章数: 6466
- 月份概览: [2026-04](/archive/2026/04/) (494)、[2026-03](/archive/2026/03/) (905)、[2026-02](/archive/2026/02/) (2318)、[2026-01](/archive/2026/01/) (2749)

### [2025 年](/archive/2025/)
- 年度文章数: 10386
- 月份概览: [2025-12](/archive/2025/12/) (2684)、[2025-11](/archive/2025/11/) (2842)、[2025-10](/archive/2025/10/) (2885)、[2025-09](/archive/2025/09/) (1967)、[2025-08](/archive/2025/08/) (1)、[2025-07](/archive/2025/07/) (1)

### [2024 年](/archive/2024/)
- 年度文章数: 5
- 月份概览: [2024-10](/archive/2024/10/) (2)、[2024-09](/archive/2024/09/) (2)、[2024-07](/archive/2024/07/) (1)

### [2023 年](/archive/2023/)
- 年度文章数: 3
- 月份概览: [2023-10](/archive/2023/10/) (2)、[2023-03](/archive/2023/03/) (1)
