# 分类：ai-systems

> 该分类下的文章按时间倒序排列，便于按主题继续深挖。

## 页面摘要
- 路径: /categories/ai-systems/page/56/
- 当前页: 56 / 75
- 文章总数: 5960
- 当前页文章数: 80

## 快速导航
- [首页](/)
- [分类索引](/categories/)
- [归档索引](/archive/)

## 本页文章
### [扩散策略中共享表示层的工程化：实现多任务策略转移](/posts/2025/10/21/engineering-shared-representation-layers-in-diffusion-policies-for-multi-task-transfer/)
- 日期: 2025-10-21T16:02:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 LeRobot 中工程化扩散策略的共享表示层，实现抓取和堆叠等多样机器人任务的技能转移，而无需完整重训。

### [大规模RAG系统中跨编码器重排序与倒数排名融合](/posts/2025/10/21/cross-encoder-reranking-reciprocal-rank-fusion-in-rag/)
- 日期: 2025-10-21T15:18:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对处理500万+文档的RAG系统，介绍跨编码器重排序结合倒数排名融合的实现，提升top-k相关性评分，而无需重新计算嵌入。

### [扩展 Micrograd 以支持稀疏张量自动求导：针对图神经网络的自定义反向传播](/posts/2025/10/21/extending-micrograd-with-sparse-tensor-autograd/)
- 日期: 2025-10-21T14:06:25+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 Micrograd 引擎中集成稀疏矩阵操作的自定义反向传播，实现图神经网络中不规则连接的高效自动求导与内存优化。

### [Claude 代理中动态工具选择与链式调用的工程实践：基于 Cookbook 模式](/posts/2025/10/21/dynamic-tool-chaining-claude-agents/)
- 日期: 2025-10-21T13:16:40+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Claude Cookbook 的代理模式，实现动态工具选择、多步编排与运行时错误处理，确保生产级工作流的可靠性和效率。

### [DeepSeek OCR 在边缘设备上的令牌高效部署：动态裁剪与视觉令牌编码优化](/posts/2025/10/21/deepseek-ocr-edge-token-efficient-deployment/)
- 日期: 2025-10-21T12:16:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 DeepSeek OCR 在边缘场景下的高效部署策略，通过动态裁剪和视觉令牌编码最小化 LLM 输入大小，同时保障实时布局解析准确性，提供工程参数与监控清单。

### [使用 DeepSeek OCR 工程化零样本表格提取管道：视觉编码与 LLM 后处理](/posts/2025/10/21/engineering-zero-shot-table-extraction-deepseek-ocr/)
- 日期: 2025-10-21T12:01:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 DeepSeek OCR 的零样本表格提取管道，利用视觉编码压缩和 LLM 后处理，将扫描文档转换为结构化 JSON，无需训练数据。

### [在 LeRobot 中微调扩散策略以实现灵巧操作](/posts/2025/10/21/fine-tuning-diffusion-policies-in-lerobot-for-dexterous-manipulation/)
- 日期: 2025-10-21T11:16:40+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向灵巧操作任务，给出 LeRobot 中扩散策略微调的工程化参数与数据适应要点。

### [在 Open Notebook 中构建可扩展的多轮 LLM 链式与自定义音频合成](/posts/2025/10/21/extensible-multi-turn-llm-chaining-custom-audio-synthesis-open-notebook/)
- 日期: 2025-10-21T10:31:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Open Notebook 中多轮 LLM 链式与自定义 TTS 的工程实践，用于从多样来源生成灵活播客。

### [Skyvern 中集成 YOLO 模型实现浏览器自动化 UI 元素精确定位](/posts/2025/10/21/integrating-yolo-for-precise-ui-element-localization-in-skyvern-browser-automation/)
- 日期: 2025-10-21T10:03:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨在 Skyvern 框架中集成 YOLO 模型，用于浏览器自动化中的 UI 元素检测，提供子像素精度和假阳性过滤的工程参数与实现要点。

### [工程化 PP-OCRv4 混合 CNN-Transformer 管道：扫描文档弯曲文本检测与边缘部署优化](/posts/2025/10/21/engineer-pp-ocrv4-hybrid-cnn-transformer-pipeline-for-curved-text-detection-in-scanned-docs-with-edge-optimization/)
- 日期: 2025-10-21T09:46:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对扫描文档中的弯曲/不规则文本，工程化 PP-OCRv4 的混合 CNN-Transformer 管道，提供动态分辨率裁剪和边缘部署参数配置。

### [生产环境中 RAG 的学习型查询扩展与端到端评估指标实现](/posts/2025/10/21/implementing-learned-query-expansion-and-evaluation-metrics-in-production-rag/)
- 日期: 2025-10-21T09:31:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文聚焦生产 RAG 系统中的学习型查询扩展技术实现，包括 LLM 驱动的扩展方法与参数优化；同时介绍端到端评估指标，如上下文精确率、忠实度和事实正确性，用于持续性能监控与迭代。

### [构建可扩展 TypeScript 管道：多轮 LLM 链式交互与播客生成](/posts/2025/10/21/extensible-typescript-pipeline-multi-turn-llm-chaining-podcast-generation/)
- 日期: 2025-10-21T08:06:12+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 TypeScript 构建多轮 LLM 链式管道，支持流式响应、音频合成和自定义工具集成，实现灵活的播客生成，超越单一笔记本限制。

### [AI 代理的提示逆向工程：拦截 API 调用与行为模式分析实现模块化组成](/posts/2025/10/21/reverse-engineering-ai-system-prompts-for-modular-agents/)
- 日期: 2025-10-21T08:01:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过拦截 API 调用和分析行为模式，从 20+ AI 工具中提取系统提示，实现自定义工具集成的模块化代理构建，提供工程参数与监控要点。

### [用 LeRobot 构建可访问的端到端 AI 机器人学习管道](/posts/2025/10/21/lerobot-end-to-end-learning-accessibility/)
- 日期: 2025-10-21T07:16:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向低成本操作任务，集成数据收集、模型训练和硬件部署的 LeRobot 端到端管道。

### [用 Micrograd 构建向量化自动求导引擎：拓扑排序反向传播支持的 PyTorch 式神经网络训练](/posts/2025/10/21/building-vectorized-autograd-engine-with-micrograd/)
- 日期: 2025-10-21T06:47:05+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Micrograd 的纯 Python 实现，探讨 scalar autograd 如何通过 Value 列表模拟向量化操作，并利用拓扑排序实现高效 backprop，支持简单神经网络的训练参数与 API 设计。

### [使用提示工程实现确定性 LLM 分类输出](/posts/2025/10/21/deterministic-llm-classification-with-prompt-consistency/)
- 日期: 2025-10-21T06:31:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向生产环境中的 LLM 分类任务，介绍结构化思维链提示、少样本示例和零温度采样的工程实践，以最小化输出方差。

### [用 PaddleOCR 构建轻量级 OCR 系统：解析 PDF/图像为 LLM 结构化数据，支持 100+ 语言](/posts/2025/10/21/building-lightweight-ocr-system-with-paddleocr-parsing-pdfs-images-into-structured-data-for-llms/)
- 日期: 2025-10-21T06:16:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 PaddleOCR 开发高效 OCR 系统，从 PDF 和图像中提取结构化数据，支持多语言文本检测与识别，便于集成到 LLM 工作流中。

### [Claude Cookbook：Jupyter 中模块化提示工程与工具集成实践](/posts/2025/10/21/claude-cookbooks-prompt-engineering-tool-integration-jupyter/)
- 日期: 2025-10-21T06:06:06+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Claude Cookbook，利用 Jupyter notebooks 工程化模块化提示模式和工具集成，实现可重现的 AI 工作流和智能代理应用。包括提示模板设计、工具调用参数及 agentic 工作流优化要点。

### [LeRobot数据流水线：传感器融合与仿真到真实迁移的关键参数配置](/posts/2025/10/21/lerobot-data-pipeline-sensor-fusion/)
- 日期: 2025-10-21T05:17:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 解析LeRobot中多传感器时间对齐、域随机化参数与扩散策略训练的数据增强技术，提供可落地的工程化配置清单。

### [使用 Claude 实现浏览器原生代码生成与 Web 集成](/posts/2025/10/21/browser-native-claude-code-generation-web-integration/)
- 日期: 2025-10-21T05:01:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 工程化 Claude 在浏览器中的代码生成与执行，支持无缝协作编辑、实时反馈和零设置开发环境。

### [DeepSeek OCR 中的零样本布局分析：基于视觉语言提示的工程实现](/posts/2025/10/21/deepseek-ocr-zero-shot-layout-analysis/)
- 日期: 2025-10-21T04:46:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 DeepSeek-VL 通过视觉语言提示实现零样本文档布局检测，提供工程参数和监控要点。

### [BERT作为单步文本扩散：掩码语言建模的去噪视角](/posts/2025/10/21/bert-as-single-step-text-diffusion/)
- 日期: 2025-10-21T04:08:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 将BERT的掩码语言建模目标重新诠释为扩散模型的一个去噪步骤，实现无自回归解码的迭代文本生成精炼。

### [Token-Efficient Edge Deployment of DeepSeek-OCR: Dynamic Resolution Cropping and Visual Encoding](/posts/2025/10/21/token-efficient-edge-deployment-of-deepseek-ocr-dynamic-resolution-cropping-and-visual-encoding/)
- 日期: 2025-10-21T04:01:57+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 DeepSeek-OCR 通过动态分辨率裁剪和视觉编码优化，实现边缘设备上的实时多语言文档扫描，包含工程参数和最佳实践。

### [生产级RAG系统中BM25与嵌入混合检索：学习式查询扩展与端到端评估指标](/posts/2025/10/21/hybrid-bm25-and-embedding-retrieval-in-production-rag-learned-query-expansion-and-end-to-end-evaluation-metrics/)
- 日期: 2025-10-21T03:31:40+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨5M+文档RAG系统的混合检索实现，包括BM25与向量嵌入融合、学习查询扩展，以及召回/精确率权衡的评估策略，提供工程参数与监控要点。

### [RAG 工程化实践：5M+ 文档摄入中的 MinHash LSH 近重复去重与语义质量过滤](/posts/2025/10/21/rag-5m-docs-ingestion-minhash-lsh-duplication-removal-semantic-quality-filtering/)
- 日期: 2025-10-21T03:02:52+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 5M+ 文档处理经验，详解 MinHash LSH 近重复去重与语义阈值质量过滤的工程参数，确保 RAG 索引纯净高效。

### [LLM 与计算机视觉整合：Skyvern 的自适应浏览器自动化](/posts/2025/10/21/integrating-llms-with-computer-vision-for-browser-automation/)
- 日期: 2025-10-21T02:48:47+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 LLM 和计算机视觉实现浏览器自动化，针对非结构化网页的动态元素检测与工作流执行，提供工程化参数与恢复机制。

### [使用AST工程化可执行心理状态代码模型：AI心智理论的多代理社会推理](/posts/2025/10/21/engineering-executable-mental-state-models-with-asts-for-ai-theory-of-mind/)
- 日期: 2025-10-21T02:16:47+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何通过抽象语法树（AST）将推断的心理状态转化为可执行代码，实现AI代理在多代理交互中的人类般社会推理，提供工程参数和落地清单。

### [在微型标量 Autograd 引擎中实现向量化操作：启用 PyTorch-like 神经网络训练](/posts/2025/10/21/implementing-vectorized-operations-in-a-tiny-scalar-autograd-engine/)
- 日期: 2025-10-21T01:47:07+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何在 micrograd 等标量自动求导引擎中引入向量化操作，支持高效的 PyTorch 风格神经网络训练，同时保持最小开销的教育性实现。

### [ebook2audiobook 中的多语言零样本语音克隆实现](/posts/2025/10/21/ebook2audiobook-multi-language-voice-cloning/)
- 日期: 2025-10-21T01:16:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 ebook2audiobook 如何通过 XTTSv2 等模型实现多语言零样本语音克隆，支持全球电子书到有声书的转换。

### [收集与逆向工程20+ AI工具系统提示：构建统一工具调用与模块化代理](/posts/2025/10/21/collecting-and-reverse-engineering-system-prompts-from-20-ai-tools-for-modular-agents/)
- 日期: 2025-10-21T01:01:53+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 汇总Devin、Cursor、Claude等工具的系统提示，提取工具调用、上下文管理和错误处理模式，帮助构建可靠的模块化AI代理。

### [工程化可扩展 RAG：处理 500 万文档的切块策略、混合检索索引与评估指标](/posts/2025/10/21/scaling-production-rag-5m-docs-pipelines/)
- 日期: 2025-10-21T00:16:40+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从处理超过 500 万文档的生产部署经验中，探讨工程化可扩展 RAG 系统，包括语义保留的切块策略、混合检索索引优化，以及关键评估指标与落地参数。

### [使用 Playwright 和 Claude 实现低上下文浏览器自动化](/posts/2025/10/21/low-context-browser-automation-with-playwright-and-claude/)
- 日期: 2025-10-21T00:02:25+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 Playwright MCP Server 集成 Claude AI，实现高效浏览器自动化，聚焦低上下文优化，提供工程参数与实践清单。

### [将 BERT 工程化为单步扩散解码器：高效文本生成实践](/posts/2025/10/20/engineering-bert-as-single-step-diffusion-decoder/)
- 日期: 2025-10-20T22:50:21+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过将 BERT 的掩码语言模型解释为单步扩散过程，实现高效的文本生成，支持直接采样而无需迭代去噪，提供工程参数与实现指南。

### [在 LeRobot 中微调扩散策略：面向灵巧操作的任务稳定性与样本效率优化](/posts/2025/10/20/fine-tuning-diffusion-policies-in-lerobot-for-dexterous-manipulation/)
- 日期: 2025-10-20T22:33:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨使用 LeRobot 框架对扩散策略进行微调，实现端到端学习在机器人硬件上的灵巧操作，重点优化噪声调度、奖励塑造等参数以提升策略稳定性和样本利用率。

### [DeepSeek OCR 工程化布局保持文本检测：复杂文档空间层次保留](/posts/2025/10/20/deepseek-ocr-layout-preserving-detection/)
- 日期: 2025-10-20T22:02:00+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 DeepSeek OCR 实现复杂文档的布局保持文本检测，保留空间层次以提升下游 RAG 和 NLP 管道效率。

### [Qwen2.5 推理引擎内核融合与动态量化实现：Nvidia GPU 内存使用减少 82%](/posts/2025/10/20/implementing-kernel-fusion-and-dynamic-quantization-in-qwen25-inference-engine-82-reduction-in-nvidia-gpu-memory-usage/)
- 日期: 2025-10-20T21:16:42+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过内核融合和动态量化优化Qwen2.5推理引擎，实现Nvidia GPU内存使用减少82%，并维持吞吐量，适用于大型AI服务。

### [Reverse-Engineering-Devin-Cursor-Claude-Prompts-for-Modular-AI-Agents](/posts/2025/10/20/reverse-engineering-devin-cursor-claude-prompts-for-modular-ai-agents/)
- 日期: 2025-10-20T21:02:27+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从 Devin、Cursor 和 Claude 的内部提示中提取工具调用、上下文管理和错误处理机制，指导构建可靠的模块化 AI 代理，包括参数配置和监控要点。

### [在 Qwen-VL 中实现动态张量重构和低秩适应以实现高效多模态推理](/posts/2025/10/20/implement-dynamic-tensor-rematerialization-low-rank-adaptation-qwen-vl-efficient-multi-modal-inference/)
- 日期: 2025-10-20T20:46:43+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过动态张量重构和低秩适应技术，在 Qwen-VL 模型中优化多模态推理，实现 GPU 利用率降低 82%，并提供运行时调度参数和监控要点。

### [使用 LeRobot 细调扩散策略实现灵巧操纵](/posts/2025/10/20/fine-tuning-diffusion-policies-with-lerobot-for-dexterous-manipulation/)
- 日期: 2025-10-20T20:06:07+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文探讨如何利用 LeRobot 框架在机器人数据集上细调 Diffusion Policy，支持灵巧操纵任务，并集成真实硬件进行端到端部署。提供配置参数、训练清单和监控要点。

### [用端到端学习构建可访问的 AI 机器人：从数据集模仿到强化微调](/posts/2025/10/20/building-accessible-ai-robotics-with-end-to-end-learning/)
- 日期: 2025-10-20T19:16:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 Hugging Face 的 LeRobot 库，利用端到端学习从演示数据集训练机器人策略，支持硬件无关的政策，并在 PyTorch 中实现真实世界操纵任务的强化微调。

### [Modular LLM Chaining for Multi-Turn Podcast Generation in Open-Notebook](/posts/2025/10/20/modular-llm-chaining-for-multi-turn-podcast-generation-in-open-notebook/)
- 日期: 2025-10-20T18:47:03+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 Open-Notebook 中利用模块化 LLM 链式调用，实现多轮互动播客生成，支持动态上下文传递和响应精炼，提供工程化参数和最佳实践。

### [OpenVoice 中基于 VAE 的韵律与情感转移：用于表达性短参考有声书合成](/posts/2025/10/20/openvoice-prosody-emotion-transfer/)
- 日期: 2025-10-20T18:17:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 OpenVoice 通过 VAE 编码和风格令牌实现韵律与情感转移的技术细节，支持无语言特定再训练的表达性有声书合成，提供工程参数与落地指南。

### [ebook2audiobook 中的跨语言零样本语音克隆：自动语言检测与口音适应](/posts/2025/10/20/cross-lingual-voice-cloning-ebook2audiobook/)
- 日期: 2025-10-20T18:06:16+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 集成 XTTSv2 实现 ebook2audiobook 的多语言语音克隆，支持 1100+ 语言的自然有声书生成与 fallback 策略。

### [集成 PP-OCRv4 布局模块：从复杂扫描 PDF 中提取结构化表格与表单](/posts/2025/10/20/integrate-pp-ocrv4-layout-module-for-table-form-extraction-in-complex-scanned-pdfs/)
- 日期: 2025-10-20T17:35:11+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文探讨如何将 PP-OCRv4 的布局分析模块集成到 RAG 管道中，从复杂扫描 PDF 中检测并提取表格和表单，使用自适应边界框合并和向量化技术，实现高效的结构化数据处理。提供工程化参数和落地清单。

### [Multi-Speaker Voice Cloning Pipeline for Expressive Audiobooks](/posts/2025/10/20/multi-speaker-voice-cloning-audiobook-pipeline/)
- 日期: 2025-10-20T16:17:30+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 工程化实现 ebook2audiobook 与 XTTSv2 的多说话者 TTS 管道，处理章节节奏、情感过渡及 1100+ 语言支持，实现最小 artifacts 的 audiobook 合成。

### [DeepSeek-OCR 多模态表格提取：布局解析与结构化 JSON 输出](/posts/2025/10/20/deepseek-ocr-multimodal-table-extraction/)
- 日期: 2025-10-20T16:06:28+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 DeepSeek-OCR 的视觉语言融合技术，从复杂文档图像中提取表格，解析布局生成带单元格合并和关系推理的 JSON 结构，适用于 LLM 输入优化。

### [使用 DeepSeek OCR 构建低延迟 OCR 推理管道：布局分析、多语言提取与 GPU 批处理](/posts/2025/10/20/low-latency-ocr-inference-pipeline-deepseek-optimization/)
- 日期: 2025-10-20T16:05:24+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向可扩展文档处理，集成 DeepSeek OCR 的低延迟推理管道，涵盖布局分析、多语言文本提取及 GPU 批处理优化参数与监控策略。

### [MiniMind 中集成旋转位置嵌入：优化因果注意力长序列处理与外推](/posts/2025/10/20/integrate-rotary-embeddings-minimind-causal-attention-long-sequence-extrapolation/)
- 日期: 2025-10-20T15:16:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 MiniMind 框架中集成 RoPE 以提升小规模 GPT 训练的长序列处理能力，提供外推参数调优和工程实践要点。

### [DeepSeek-VL2 多模态 OCR：视觉编码器与 LLM 端到端集成](/posts/2025/10/20/deepseek-vl2-multimodal-ocr-integration/)
- 日期: 2025-10-20T14:46:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: DeepSeek-VL2 通过 MoE 架构统一训练视觉与语言模型，实现文档端到端 OCR，支持布局分析和多语言提取。提供工程参数、监控要点和部署指南。

### [英伟达 Blackwell 在美晶圆生产与芯片let 组装工程](/posts/2025/10/20/nvidia-blackwell-us-wafer-production-chiplet-assembly/)
- 日期: 2025-10-20T14:06:16+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对多芯片let B200 GPU 的 CoWoS 封装集成，提供本土晶圆生产下的工程参数与供应链弹性策略。

### [OpenVoice 零样本跨语言语音克隆工程：音色保留、口音检测阈值与多语言音色迁移](/posts/2025/10/20/engineering-zero-shot-cross-lingual-voice-cloning-in-openvoice/)
- 日期: 2025-10-20T13:31:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 audiobook 合成，提供 OpenVoice 零样本跨语言克隆的音色保留、口音适应阈值及迁移参数工程指南。

### [实现 PP-OCRv4 双阶段多语言 OCR 管道：DBNet++ 检测与 SVTR-Lite 识别](/posts/2025/10/20/implementing-pp-ocrv4-dual-stage-multilingual-pipeline/)
- 日期: 2025-10-20T13:01:57+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 PP-OCRv4 构建高效多语言 OCR 系统，聚焦 DBNet++ 旋转文本检测和 SVTR-Lite 轻量识别，实现 <10MB 模型边缘部署。

### [用信息论调优 LLM 提示词冗余度生成 DSL 代码](/posts/2025/10/20/tuning-llm-prompt-verbosity-with-information-theory-for-dsl-code-generation/)
- 日期: 2025-10-20T12:16:28+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用熵等信息论指标优化 LLM 提示词的详细程度，在生成 Q/Kdb 等 DSL 可执行代码时，避免简洁输出导致的语法错误，同时控制令牌成本。

### [DeepChat 中集成本地日历、邮件和文件 API：TypeScript 隐私保护个人 AI 助手集成](/posts/2025/10/20/integrate-local-calendar-email-file-apis-deepchat-typescript-privacy/)
- 日期: 2025-10-20T12:01:43+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探索在 DeepChat TypeScript 框架下集成本地 API，实现 AI 助手对日历、邮件和文件的隐私访问，无需云服务。提供配置、代码示例和安全实践。

### [OpenVoice 零-shot 语音克隆部署：3秒参考音频嵌入提取与实时合成优化](/posts/2025/10/20/openvoice-zero-shot-voice-cloning-deployment/)
- 日期: 2025-10-20T10:06:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向即时语音克隆，给出 OpenVoice 嵌入提取、PyTorch serving 部署与低延迟优化的工程参数。

### [Skyvern 中视觉 LLM 的自适应提示策略：处理 UI 布局变异的工程实践](/posts/2025/10/20/skyvern-adaptive-vision-prompting/)
- 日期: 2025-10-20T10:01:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Skyvern 通过动态提示精炼和 few-shot 适应，提升视觉 LLM 在不同 UI 布局下的元素选择鲁棒性，提供工程参数和监控要点。

### [Tool-Calling Integrations in Claude Cookbook for Agentic AI Workflows](/posts/2025/10/20/tool-calling-integrations-in-claude-cookbook-for-agentic-ai-workflows/)
- 日期: 2025-10-20T09:46:52+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探索 Claude Cookbook 中的工具调用示例，实现代理式工作流，支持动态 API 交互和结构化响应解析，无需外部协调器。提供工程化参数和监控要点。

### [OpenVoice 多说话者语气与情绪调制工程实践：有声书适应性合成](/posts/2025/10/20/openvoice-multi-speaker-tone-control/)
- 日期: 2025-10-20T09:02:12+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 OpenVoice TTS 实现多说话者混合的语气和情绪精细控制，针对有声书场景，提供上下文感知的语音合成工程参数与监控要点。

### [使用语义嵌入子主题聚类增强 Pyversity RAG 的结果多样化](/posts/2025/10/20/enhancing-pyversity-rag-with-subtopic-clustering-using-semantic-embeddings/)
- 日期: 2025-10-20T07:16:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过语义嵌入对检索结果进行子主题聚类，结合 Pyversity 的多样化策略，实现查询多方面的平衡覆盖，避免 MMR 贪婪选择的局限，提供工程化参数和实现指南。

### [生产 AI 系统中的原子模型交换：零停机替换与版本化检查点同步](/posts/2025/10/20/atomic-model-swaps-for-zero-downtime-in-ai-systems/)
- 日期: 2025-10-20T05:47:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向生产 AI 系统，实现原子模型交换的零停机部署策略，包括版本化检查点同步、双缓冲机制与监控要点。

### [全量微调与 PEFT 方法如 LoRA 的效率-泛化权衡](/posts/2025/10/20/full-fine-tuning-vs-peft-lora-efficiency-generalization-tradeoffs/)
- 日期: 2025-10-20T05:31:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 评估全量微调与 LoRA 等 PEFT 方法在计算成本与任务特定泛化方面的权衡，提供 LLM 管道中的工程化参数与监控要点。

### [ebook2audiobook 中的多语音融合叙事：克隆语音与韵律控制实现](/posts/2025/10/20/multi-voice-blending-narrative-in-ebook2audiobook/)
- 日期: 2025-10-20T05:16:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 XTTSv2 在 ebook2audiobook 中实现多角色语音克隆、韵律调整与无缝过渡，构建角色驱动的有声书叙事。

### [通过拓扑排序优化微型自动微分引擎中的反向传播调度](/posts/2025/10/20/topological-sort-for-backprop-scheduling-in-tiny-autograd-engines/)
- 日期: 2025-10-20T04:17:05+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨在动态计算图中利用拓扑排序优化反向传播调度，提升微型 autograd 引擎如 micrograd 的效率，提供工程参数与实现要点。

### [Skyvern 中基于 YOLO 的 CV 元素定位：实现无选择器浏览器自动化](/posts/2025/10/20/yolo-cv-element-localization-skyvern-browser-automation/)
- 日期: 2025-10-20T04:01:47+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 Skyvern 框架中集成 YOLO 计算机视觉模型，用于动态 UI 元素检测，实现适应布局变化的无选择器浏览器交互自动化。

### [Pyversity 中 FAISS 索引分片：实现百万规模 RAG 的并行多样化查询](/posts/2025/10/20/pyversity-faiss-index-sharding-for-scalable-rag/)
- 日期: 2025-10-20T03:46:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向百万规模文档集，在 Pyversity 中通过 FAISS 索引分片实现低延迟 RAG，支持动态负载均衡与多样化 reranking 的工程实践。

### [工程化可组合AI代理：零-shot适应与工具集成替换软件工作流手动任务](/posts/2025/10/20/engineering-composable-ai-agents-zero-shot-task-automation/)
- 日期: 2025-10-20T03:04:29+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 构建可组合AI代理实现软件工作流自动化，提供零-shot适应参数、工具集成清单与工程落地要点。

### [工程化可组合AI代理：零-shot适应与工具集成替换软件工作流手动任务](/posts/2025/10/20/engineering-composable-ai-agents-for-task-automation/)
- 日期: 2025-10-20T03:01:48+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 构建可组合AI代理，实现软件工作流中手动任务的零-shot自动化替换，提供工具集成参数和工程实践。

### [大语言模型中继续预训练 vs 指令调优：效率与控制比较](/posts/2025/10/20/continued-pretraining-vs-instruction-tuning-llms-efficiency-control/)
- 日期: 2025-10-20T02:31:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 比较继续预训练用于知识注入与指令调优用于任务对齐在大语言模型中的效率和控制，提供生产适配管道的实用参数和清单。

### [浏览器交互中 CV 元素定位工程：动态 UI 检测与模拟](/posts/2025/10/20/cv-element-localization-browser-interaction/)
- 日期: 2025-10-20T02:16:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨使用计算机视觉管道工程化浏览器中动态 UI 元素的检测与交互模拟，实现 LLM 驱动自动化对布局变化的弹性，通过实时视觉反馈循环提升鲁棒性。

### [ESP32 与 WebRTC 集成实现实时语音 AI 处理](/posts/2025/10/20/esp32-webrtc-voice-ai-integration/)
- 日期: 2025-10-20T01:31:43+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 将 ESP32 微控制器与 WebRTC 结合，用于电池供电徽章上的低延迟音频流和本地 AI 推理，提供工程参数和监控要点。

### [在 Pyversity 中实现 MMR 评分：平衡 RAG 检索的相关性和多样性](/posts/2025/10/20/implement-mmr-scoring-in-pyversity/)
- 日期: 2025-10-20T00:31:36+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 详细介绍 MMR 算法在 Pyversity 中的应用，优化 lambda 参数和余弦相似度以提升 RAG 系统检索效率和多样性。

### [工程化可扩展的 SvelteKit 前端 UI：支持多 LLM 对话、流式响应与模型切换的 Hugging Face Chat UI](/posts/2025/10/20/engineering-extensible-sveltekit-ui-for-multi-llm-conversations-with-streaming-and-model-switching-in-hugging-face-chat-ui/)
- 日期: 2025-10-20T00:16:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 Hugging Face Chat UI 的 SvelteKit 实现，提供多 LLM 集成、流式响应处理与模型切换的工程化配置与监控要点。

### [在 RAG 系统集成 Pyversity 实现检索结果多样化](/posts/2025/10/19/integrate-pyversity-for-rag-result-diversification/)
- 日期: 2025-10-19T23:17:05+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文介绍如何在 RAG 系统中集成 Pyversity 库，利用 MMR 算法平衡检索 chunk 的相关性和新颖性，提供集成步骤、参数调优和工程实践要点。

### [用 TypeScript 构建可扩展的 NotebookLM 克隆：多格式导出、自定义语音合成与模块化 LLM 链式](/posts/2025/10/19/engineering-extensible-notebooklm-clone-typescript-multi-format-exports-custom-voice-synthesis-modular-llm-chaining/)
- 日期: 2025-10-19T22:46:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于开源项目，探讨 TypeScript 工程实践，实现多格式内容导出、自定义语音合成集成及模块化 LLM 链式，支持个性化知识合成。

### [LLM 微调复兴：使用 LoRA 适配器实现高效领域特定适应](/posts/2025/10/19/reviving-llm-fine-tuning-with-lora-adapters/)
- 日期: 2025-10-19T22:06:19+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 LLM 微调的复兴战略，使用 LoRA 适配器避免全模型重训，实现计算成本与性能的平衡，支持领域特定适应如金融和代码生成。

### [Skyvern 中 LLM 视觉任务分解：适应性导航与交互失败恢复](/posts/2025/10/19/llm-vision-task-decomposition-in-skyvern/)
- 日期: 2025-10-19T22:01:36+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 LLM 和计算机视觉分解复杂浏览器任务，提供动态 UI 适应与失败恢复策略。

### [Open Notebook：构建开源 NotebookLM 替代品，支持可扩展提示、TTS 语音克隆与多格式导出](/posts/2025/10/19/open-notebook-building-notebooklm-alternative-tts-cloning-exports/)
- 日期: 2025-10-19T20:46:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Open Notebook 项目，探讨如何通过可扩展提示集成多模型 AI、TTS 语音克隆生成个性化播客，以及多格式导出实现自定义 AI 音频/播客从文档生成。

### [构建 Micrograd：微型 Python Autograd 引擎](/posts/2025/10/19/building-micrograd-tiny-autograd-engine-python/)
- 日期: 2025-10-19T20:16:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从零构建一个小型 autograd 引擎，实现标量值的反向传播，支持 PyTorch 风格 API，用于教育性神经网络实现。

### [在 TTS 系统部署 OpenVoice 实现零样本即时语音克隆](/posts/2025/10/19/deploying-openvoice-for-zero-shot-voice-cloning-in-tts/)
- 日期: 2025-10-19T19:46:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 TTS 系统的 OpenVoice 部署指南：零样本克隆、多语言合成与音色参数优化。

### [MCP Java SDK 中的令牌认证与上下文隔离：Spring AI 多租户安全编排实践](/posts/2025/10/19/token-based-authentication-and-context-isolation-in-mcp-java-sdk-for-secure-multi-tenant-spring-ai-orchestration/)
- 日期: 2025-10-19T18:46:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在多租户 Spring AI 环境中，利用 MCP Java SDK 实现 OAuth 2.0 令牌认证与租户上下文隔离的工程化方案与参数配置。