# Hotdry Blog

> 代码、系统与工程实践的长期写作记录，适合按文章、分类和归档路径持续检索。

## 页面摘要
- 路径: /page/730/
- 当前页: 730 / 843
- 每页文章数: 20
- 文章总数: 16860
- 分类数: 267
- 归档年份数: 4
- 归档月份数: 17

## 快速导航
- [分类索引](/categories/)
- [归档索引](/archive/)
- [关于](/about/)
- [RSS](/rss.xml)

## 本页文章
### [使用 Parlant 工程化部署 LLM 代理：模块化架构与快速部署](/posts/2025/10/03/engineering-deployable-llm-agents-with-parlant-modular-architecture/)
- 日期: 2025-10-03T19:47:16+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Parlant 框架在 LLM 控制代理工程中的应用，聚焦模块化设计、分钟级部署及生产集成模式。

### [Vega OS 中容器编排工程：无缝开发者工作流](/posts/2025/10/03/engineering-container-orchestration-in-vega-os-for-developer-workflows/)
- 日期: 2025-10-03T19:32:03+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 探讨 Amazon Vega OS 中的容器编排工程实践，提供代码执行、调试和部署隔离的内置工具配置参数与优化策略。

### [在 Triton 中利用 Cutlass 内核命名解锁 FP8 张量核心加速](/posts/2025/10/03/leverage-cutlass-kernel-naming-in-triton-for-fp8-tensor-core-acceleration/)
- 日期: 2025-10-03T19:16:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 借助 Triton 借鉴 Cutlass 内核命名，实现 FP8 GEMM 优化，在 LLM 多头注意力推理中获得约 100 TFLOPS 加速，提供工程参数与监控要点。

### [Orchestrating AI Agents with Microsoft Agent Framework: Python and .NET Support](/posts/2025/10/03/orchestrating-ai-agents-with-microsoft-agent-framework-python-and-dotnet-support/)
- 日期: 2025-10-03T18:47:36+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向多代理工作流，给出 Microsoft Agent Framework 的 Python/.NET 集成、编排参数与工具配置要点。

### [浏览器端 Iceberg 表解析：Icebird 库的实现与配置](/posts/2025/10/03/icebird-js-iceberg-table-reader/)
- 日期: 2025-10-03T18:33:44+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 探讨 Icebird JavaScript 库如何在浏览器中解析 Apache Iceberg 元数据并解码 Parquet 文件，实现客户端查询大表数据。

### [Optimizing Multi-Arch Caching in GitHub Actions Runners](/posts/2025/10/03/optimizing-multi-arch-caching-in-github-actions-runners/)
- 日期: 2025-10-03T18:19:01+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 在异构 CI/CD 环境中，针对 arm64/x86 的 GitHub Actions runner 图像优化 Docker 层缓存策略，减少构建时间并提升共享效率。

### [将 Kyber-512 KEM 集成到 Signal 双棘轮协议中：混合 PQ-经典前向保密优化](/posts/2025/10/03/kyber-512-integration-signal-double-ratchet/)
- 日期: 2025-10-03T18:08:01+08:00
- 分类: [ai-security](/categories/ai-security/)
- 摘要: 在 Signal 双棘轮协议中集成 Kyber-512 密钥封装机制，实现混合后量子-经典前向保密，通过优化链长度和 HKDF 参数，确保移动消息传递延迟开销小于 5ms。

### [结合 LLM 引导模糊测试与符号执行发现 Curl HTTP/3 内存损坏](/posts/2025/10/03/ai-hybrid-fuzzing-symbolic-execution-curl-http3/)
- 日期: 2025-10-03T18:03:17+08:00
- 分类: [ai-security](/categories/ai-security/)
- 摘要: 面向 Curl HTTP/3 多流状态机，给出 LLM 引导混合模糊测试与符号执行的工程化参数与监控要点。

### [Triton 中 Cutlass 命名内核的 FP8 张量操作剖析：通过运行时优化解锁 100 TFLOPS 加速](/posts/2025/10/03/triton-fp8-cutlass-benchmarking/)
- 日期: 2025-10-03T17:48:20+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Triton 中 FP8 精度下 Cutlass 风格内核的性能剖析与基准测试，提供运行时优化参数和硬件利用分析，实现高 TFLOPS 加速。

### [使用 JAX 在 Tunix 中实现量化感知后训练：针对边缘 LLM 的 4/8 位压缩](/posts/2025/10/03/quantization-aware-post-training-in-tunix-using-jax-for-edge-llm-compression/)
- 日期: 2025-10-03T17:34:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 Tunix 框架下，利用 JAX 自动微分构建量化感知的后训练管道，实现 4/8 位 LLM 压缩，聚焦校准数据集、混合精度内核和低延迟推理优化，适用于移动/边缘设备部署。

### [Signal 协议中将 X3DH 迁移至 PQXDH 以实现量子安全的群组密钥协商](/posts/2025/10/03/migrating-x3dh-to-pqxdh-in-signal-protocol-for-quantum-safe-group-key-agreement/)
- 日期: 2025-10-03T17:18:28+08:00
- 分类: [ai-security](/categories/ai-security/)
- 摘要: 探讨在 Signal 协议中采用 PQXDH 实现量子安全的群组密钥协商，优化多方棘轮机制与低延迟混合经典-后量子握手，提供工程化参数与监控要点。

### [分布式 KV 存储中的有界负载一致性哈希实现](/posts/2025/10/03/bounded-load-consistent-hashing-for-kv-stores/)
- 日期: 2025-10-03T17:03:21+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 针对分布式键值存储，介绍有界负载一致性哈希变体，确保节点动态变化时负载不平衡因子不超过 2，提供工程参数和监控要点。

### [构建 JavaScript 客户端读取 Apache Iceberg 表：支持模式演化、分区剪枝与浏览器内 Parquet 解码](/posts/2025/10/03/building-javascript-client-for-apache-iceberg-tables/)
- 日期: 2025-10-03T16:48:45+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 面向 Apache Iceberg 表，介绍 Icebird JS 客户端的构建，支持 schema evolution、Parquet 解码及交互探索参数配置。

### [Pathway 中构建容错实时 ETL 用于 LLM RAG：数据漂移、模式演进与连接器故障的自动恢复](/posts/2025/10/03/building-fault-tolerant-real-time-etl-in-pathway-for-llm-rag-automatic-recovery-from-data-drift-schema-evolution-and-connector-failures/)
- 日期: 2025-10-03T16:33:33+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向实时 LLM RAG 应用，介绍 Pathway ETL 的容错设计，包括自动恢复机制与工程参数配置。

### [一致性哈希中加权虚拟节点的实现：异构服务器负载均衡优化](/posts/2025/10/03/implementing-weighted-virtual-nodes-in-consistent-hashing-for-heterogeneous-servers/)
- 日期: 2025-10-03T16:19:12+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 在分布式系统中，使用加权虚拟节点的一致性哈希实现异构服务器的负载均衡，优化分片策略并最小化数据迁移。

### [Granite 4.0 中 Mamba-Transformer 混合架构：实现 O(1) 序列扩展的工程实践](/posts/2025/10/03/hybrid-mamba-transformer-architecture-in-granite-4-0-engineering-o-1-sequence-scaling/)
- 日期: 2025-10-03T16:09:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 IBM Granite 4.0 LLM 的混合 Mamba-Transformer 架构，如何通过状态空间块与注意力机制融合，实现推理时 O(1) 序列长度扩展，同时保持自回归训练稳定性。提供可落地参数、监控要点与集成指南。

### [在 Triton 内核中使用 Cutlass 命名实现自定义 FP8 操作的加速](/posts/2025/10/03/using-cutlass-naming-in-triton-kernels-for-custom-fp8-ops/)
- 日期: 2025-10-03T16:06:22+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Cutlass 命名在 Triton 内核中解锁自定义 FP8 操作的 100 TFLOPS 加速，聚焦融合注意力等超出 GEMM 的应用。

### [TigerBeetle 中使用 Zig 异步运行时实现分布式事务严格可串行化隔离的工程实践](/posts/2025/10/03/engineering-strict-serializable-isolation-in-tigerbeetle-with-zig-async-runtime/)
- 日期: 2025-10-03T15:48:28+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 探讨 TigerBeetle 如何利用 Zig 的异步运行时和确定性模拟测试，在分布式集群中实现严格可串行化隔离，防止竞争条件，支持高吞吐金融转移。包括工程参数和监控要点。

### [在 DBOS 中实现 Saga 补偿模式：使用 PostgreSQL 进行分布式工作流的两阶段提交与回滚编排](/posts/2025/10/03/implementing-saga-compensation-in-dbos-with-postgresql/)
- 日期: 2025-10-03T15:33:37+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 基于 DBOS 和 PostgreSQL，介绍 Saga 补偿在分布式工作流中的应用，包括两阶段提交机制、补偿函数设计及回滚策略。

### [通过 CUTLASS 命名约定在 Triton 中实现 FP8 GEMM 内核](/posts/2025/10/03/triton-cutlass-fp8-gemm-integration/)
- 日期: 2025-10-03T15:21:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 AI 推理管道，通过 CUTLASS 命名触发 Triton FP8 GEMM 优化，实现高吞吐量通用线性代数操作的参数与监控要点。

## 热门分类
- [ai-systems](/categories/ai-systems/): 5960 篇
- [systems-engineering](/categories/systems-engineering/): 4056 篇
- [systems](/categories/systems/): 1860 篇
- [ai-security](/categories/ai-security/): 868 篇
- [application-security](/categories/application-security/): 842 篇
- [compiler-design](/categories/compiler-design/): 699 篇
- [security](/categories/security/): 526 篇
- [ai-engineering](/categories/ai-engineering/): 329 篇
- [compilers](/categories/compilers/): 322 篇
- [web](/categories/web/): 205 篇
- [general](/categories/general/): 198 篇
- [mlops](/categories/mlops/): 81 篇

## 最近归档
### [2026 年](/archive/2026/)
- 年度文章数: 6466
- 月份概览: [2026-04](/archive/2026/04/) (494)、[2026-03](/archive/2026/03/) (905)、[2026-02](/archive/2026/02/) (2318)、[2026-01](/archive/2026/01/) (2749)

### [2025 年](/archive/2025/)
- 年度文章数: 10386
- 月份概览: [2025-12](/archive/2025/12/) (2684)、[2025-11](/archive/2025/11/) (2842)、[2025-10](/archive/2025/10/) (2885)、[2025-09](/archive/2025/09/) (1967)、[2025-08](/archive/2025/08/) (1)、[2025-07](/archive/2025/07/) (1)

### [2024 年](/archive/2024/)
- 年度文章数: 5
- 月份概览: [2024-10](/archive/2024/10/) (2)、[2024-09](/archive/2024/09/) (2)、[2024-07](/archive/2024/07/) (1)

### [2023 年](/archive/2023/)
- 年度文章数: 3
- 月份概览: [2023-10](/archive/2023/10/) (2)、[2023-03](/archive/2023/03/) (1)