# Hotdry Blog

> 代码、系统与工程实践的长期写作记录，适合按文章、分类和归档路径持续检索。

## 页面摘要
- 路径: /page/652/
- 当前页: 652 / 843
- 每页文章数: 20
- 文章总数: 16860
- 分类数: 267
- 归档年份数: 4
- 归档月份数: 17

## 快速导航
- [分类索引](/categories/)
- [归档索引](/archive/)
- [关于](/about/)
- [RSS](/rss.xml)

## 本页文章
### [PaddleOCR 与 LLM 结构化提取集成：多语言 PDF/图像处理用于 RAG 管道](/posts/2025/10/19/integrating-paddleocr-with-llm-for-structured-extraction-in-multilingual-pdfs-images-for-rag-pipelines/)
- 日期: 2025-10-19T14:46:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文探讨如何将 PaddleOCR 与 LLM 结合，用于从多语言 PDF 和图像中提取结构化表格和文本，优化 RAG 管道的文档处理流程。提供端到端集成步骤、参数配置和监控要点，确保高效准确的结构化输出。

### [Horizontal Scaling of Kubernetes Control Plane: API Server Replication and Scheduler Distribution](/posts/2025/10/19/horizontal-scaling-of-kubernetes-control-plane-api-server-replication-and-scheduler-distribution/)
- 日期: 2025-10-19T14:31:33+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 在 Kubernetes 大规模集群中，通过复制 API 服务器和跨可用区分布调度器，实现 100 万节点的高可用性和低延迟调度，提供工程化参数和监控要点。

### [领域特定数据集上微调 PaddleOCR：转移学习与增强策略](/posts/2025/10/19/fine-tune-paddleocr-on-domain-specific-datasets/)
- 日期: 2025-10-19T14:16:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对医疗表单或发票等专业文档，利用转移学习和数据增强微调 PaddleOCR 模型，提升文本提取精度。详述数据准备、训练参数配置及工程实践要点。

### [Pathway 中实现动态 Schema 演进：流式 ETL 无重启列添加与类型变更](/posts/2025/10/19/dynamic-schema-evolution-in-pathway-for-streaming-etl/)
- 日期: 2025-10-19T14:06:25+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Pathway 框架中动态 Schema 演进机制，实现流式 ETL 中无缝列添加和类型变更，支持自适应 LLM 管道，避免重启中断。

### [在 Jupyter 中利用 Claude Cookbooks 实现多轮链式思考提示工程](/posts/2025/10/19/leveraging-claude-cookbooks-in-jupyter-for-multi-turn-chain-of-thought-prompting/)
- 日期: 2025-10-19T13:47:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Claude Cookbooks 在 Jupyter 环境中构建多轮对话代理，通过链式思考提示提升推理可靠性，提供结构化推理路径的参数配置与状态管理策略。

### [Leveraging Janet's PEG for Structured Data Parsing](/posts/2025/10/19/leveraging-janets-peg-for-structured-data-parsing/)
- 日期: 2025-10-19T13:35:47+08:00
- 分类: [compiler-design](/categories/compiler-design/)
- 摘要: Janet 内置 PEG 解析器用于定义文法规则，实现结构化数据提取的简洁方法，支持回溯规则而避免递归下降复杂性。

### [在MiniMind中集成梯度检查点优化内存：单GPU训练26M+ GPT模型](/posts/2025/10/19/integrate-gradient-checkpointing-minimind-memory-optimization/)
- 日期: 2025-10-19T13:16:47+08:00
- 分类: [ai-engineering](/categories/ai-engineering/)
- 摘要: 针对MiniMind的PyTorch训练管道，集成梯度检查点技术以交换计算换取内存节省，实现单消费级GPU上26M+参数GPT模型训练，避免OOM错误。

### [Postgres 流复制与逻辑复制：针对读重与写重应用的集群优化](/posts/2025/10/19/postgres-streaming-vs-logical-replication-read-write-heavy/)
- 日期: 2025-10-19T13:01:48+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 比较 Postgres 流复制和逻辑复制在读主导与写主导应用中的配置，包括延迟管理和故障切换策略，帮助优化高可用集群架构。

### [Rails中构建可重用面包屑组件：路由助手、多态路径与ARIA标签](/posts/2025/10/19/building-reusable-breadcrumbs-in-rails-with-route-helpers-polymorphic-paths-and-aria-labels/)
- 日期: 2025-10-19T12:46:52+08:00
- 分类: [application-security](/categories/application-security/)
- 摘要: 在Rails多级应用中，实现动态面包屑导航，利用路由助手和多态路径构建可重用组件，并融入ARIA标签提升可访问性，提供工程化参数和最佳实践。

### [高效 Python 算法模块实现：排序、动态规划与图遍历在工程优化中的应用](/posts/2025/10/19/python-algorithm-implementations-for-scalable-data-processing/)
- 日期: 2025-10-19T12:31:42+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 基于 TheAlgorithms/Python 仓库，探讨如何构建高效算法模块，支持可扩展数据处理与工程优化，提供实用参数配置与实现清单。

### [Turbo Streams 的监听机制：响应解析与 connectedCallback 激活](/posts/2025/10/19/turbo-stream-listening-mechanism/)
- 日期: 2025-10-19T12:16:43+08:00
- 分类: [application-security](/categories/application-security/)
- 摘要: 剖析 Turbo 如何通过 HTTP/WebSocket 响应解析检测 Turbo Stream 元素，并利用 connectedCallback 实现高效实时 DOM 操作的核心工程实践。

### [在 CI/CD 管道中使用 nvm 实现 Node.js 版本自动切换](/posts/2025/10/19/nvm-ci-cd-version-switching/)
- 日期: 2025-10-19T12:06:18+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 利用 .nvmrc 文件和 POSIX 兼容 bash 脚本，在 CI/CD 环境中自动检测 Node.js 版本，确保构建可重现性，避免 direnv 等本地依赖。

### [使用 TypeScript 集成 DeepChat 与本地日历、邮件和文件 API 构建隐私优先的个人 AI 助手](/posts/2025/10/19/integrating-deepchat-with-local-calendar-email-and-file-apis-using-typescript-for-privacy-focused-personal-ai-assistants/)
- 日期: 2025-10-19T12:01:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向隐私需求，介绍 DeepChat 的 MCP 协议与本地数据源的 TypeScript 集成方法，包括 API 连接参数、安全监控和落地清单。

### [用 Flowistry 增强 Rust unsafe 代码的指针别名跟踪](/posts/2025/10/19/enhancing-flowistry-with-pointer-alias-tracking-in-rust/)
- 日期: 2025-10-19T11:46:40+08:00
- 分类: [compiler-design](/categories/compiler-design/)
- 摘要: 探讨在 Flowistry 中集成指针分析技术，提升 Rust unsafe 代码的 IDE 支持，实现高效的所有权推断和代码导航。

### [基于开发者路线图的 BFS 图遍历：AI/ML 职业路径模拟与技能差距分析](/posts/2025/10/19/bfs-graph-traversal-developer-roadmap-career-simulation/)
- 日期: 2025-10-19T11:31:51+08:00
- 分类: [application-security](/categories/application-security/)
- 摘要: 利用开发者路线图的节点图，通过 BFS 算法进行技能差距分析和依赖解析，生成个性化的 AI/ML 职业发展路径，并自动化先决条件排序。

### [通过 MutationObserver 和 CustomEvent 委托 Turbo Stream 事件：Hotwire 应用中的高效实时 DOM 更新](/posts/2025/10/19/delegate-turbo-stream-events-via-mutationobserver-and-customevent-efficient-real-time-dom-updates-in-hotwire-apps/)
- 日期: 2025-10-19T11:16:58+08:00
- 分类: [application-security](/categories/application-security/)
- 摘要: 探讨在 Hotwire 应用中使用 MutationObserver 监听 Turbo Stream 元素添加，并通过 CustomEvent 委托事件，实现自定义实时 DOM 更新策略，包括参数配置和监控要点。

### [Pathway 与 Kafka CDC 集成：实时事件源与有状态聚合的工程实践](/posts/2025/10/19/integrate-pathway-with-kafka-cdc-for-real-time-event-sourcing-and-stateful-aggregations/)
- 日期: 2025-10-19T11:01:44+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 利用 Pathway 和 Kafka CDC 构建实时事件源管道，实现有状态聚合与精确一次处理，提供关键配置参数和部署清单。

### [在百万节点Kubernetes集群中实现分片etcd异步复制以最小化领导者选举延迟](/posts/2025/10/19/implementing-sharded-etcd-with-async-replication-for-minimizing-leader-election-latency-in-million-node-k8s-clusters/)
- 日期: 2025-10-19T10:46:38+08:00
- 分类: [systems-engineering](/categories/systems-engineering/)
- 摘要: 针对百万节点Kubernetes集群，介绍分片etcd结合异步复制的实现，减少领导者选举延迟，支持高churn环境下的容错控制平面。

### [ResNet 中实现身份跳跃连接以训练超深网络](/posts/2025/10/19/implement-identity-skip-connections-resnet-deep-training/)
- 日期: 2025-10-19T10:32:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过身份快捷连接在CNN块中传播梯度，缓解退化问题，实现152层ResNet训练的工程化指南。

### [实现AI训练数据集自动偏见检测的可扩展管道](/posts/2025/10/19/implementing-scalable-pipelines-for-automated-bias-detection-in-ai-training-datasets/)
- 日期: 2025-10-19T10:17:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用统计指标和ML审计构建自动化管道，检测训练数据偏见，解决人类识别局限，确保公平AI模型部署。

## 热门分类
- [ai-systems](/categories/ai-systems/): 5960 篇
- [systems-engineering](/categories/systems-engineering/): 4056 篇
- [systems](/categories/systems/): 1860 篇
- [ai-security](/categories/ai-security/): 868 篇
- [application-security](/categories/application-security/): 842 篇
- [compiler-design](/categories/compiler-design/): 699 篇
- [security](/categories/security/): 526 篇
- [ai-engineering](/categories/ai-engineering/): 329 篇
- [compilers](/categories/compilers/): 322 篇
- [web](/categories/web/): 205 篇
- [general](/categories/general/): 198 篇
- [mlops](/categories/mlops/): 81 篇

## 最近归档
### [2026 年](/archive/2026/)
- 年度文章数: 6466
- 月份概览: [2026-04](/archive/2026/04/) (494)、[2026-03](/archive/2026/03/) (905)、[2026-02](/archive/2026/02/) (2318)、[2026-01](/archive/2026/01/) (2749)

### [2025 年](/archive/2025/)
- 年度文章数: 10386
- 月份概览: [2025-12](/archive/2025/12/) (2684)、[2025-11](/archive/2025/11/) (2842)、[2025-10](/archive/2025/10/) (2885)、[2025-09](/archive/2025/09/) (1967)、[2025-08](/archive/2025/08/) (1)、[2025-07](/archive/2025/07/) (1)

### [2024 年](/archive/2024/)
- 年度文章数: 5
- 月份概览: [2024-10](/archive/2024/10/) (2)、[2024-09](/archive/2024/09/) (2)、[2024-07](/archive/2024/07/) (1)

### [2023 年](/archive/2023/)
- 年度文章数: 3
- 月份概览: [2023-10](/archive/2023/10/) (2)、[2023-03](/archive/2023/03/) (1)