# 分类：ai-systems

> 该分类下的文章按时间倒序排列，便于按主题继续深挖。

## 页面摘要
- 路径: /categories/ai-systems/page/57/
- 当前页: 57 / 75
- 文章总数: 5960
- 当前页文章数: 80

## 快速导航
- [首页](/)
- [分类索引](/categories/)
- [归档索引](/archive/)

## 本页文章
### [在 Jupyter 中实现协作历史滑块：使用操作变换支持无冲突并发编辑](/posts/2025/10/19/implementing-history-slider-in-jupyter-for-collaboration-with-operational-transformation/)
- 日期: 2025-10-19T18:31:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Jupyter 多用户协作中历史滑块的工程实现，基于操作变换 (OT) 算法处理 undo/redo，确保并发编辑一致性，提供参数配置与监控要点。

### [Deploy Quantized TensorFlow Lite Models on Coral NPU for Sub-1W Real-Time Multi-Model Inference](/posts/2025/10/19/deploy-quantized-tensorflow-lite-models-on-coral-npu-for-sub-1w-real-time-multi-model-inference/)
- 日期: 2025-10-19T18:06:09+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何利用 Coral NPU 的硬件-软件协同设计，在边缘设备上部署量化 TFLite 模型，实现低功耗实时多模型推理，包括内核融合和运行时调度的最佳参数与实践。

### [使用 LLM 上下文重排序和置信阈值构建 PaddleOCR 后 OCR 错误校正管道](/posts/2025/10/19/building-paddleocr-post-ocr-error-correction-pipeline-with-llm-contextual-reranking-and-confidence-thresholding/)
- 日期: 2025-10-19T17:16:43+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文探讨如何利用 LLM 上下文重排序和置信阈值技术，构建 PaddleOCR 的后处理错误校正管道，提升多语言文档提取准确性，适用于 RAG 系统。提供工程化参数、阈值设置及实现清单。

### [Coral NPU 上并发多模型推理的运行时调度器设计：低延迟切换与内存分区优化](/posts/2025/10/19/runtime-scheduler-for-concurrent-multi-model-inference-on-coral-npu-low-latency-switching-and-memory-partitioning/)
- 日期: 2025-10-19T16:31:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对电池受限 IoT 设备，探讨 Coral NPU 多模型并发推理的调度策略，包括上下文切换机制、共享内存分配参数，以及功耗优化要点，确保低延迟和高效率。

### [PaddleOCR 与 LLM 结构化提取集成：多语言 PDF/图像处理用于 RAG 管道](/posts/2025/10/19/integrating-paddleocr-with-llm-for-structured-extraction-in-multilingual-pdfs-images-for-rag-pipelines/)
- 日期: 2025-10-19T14:46:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文探讨如何将 PaddleOCR 与 LLM 结合，用于从多语言 PDF 和图像中提取结构化表格和文本，优化 RAG 管道的文档处理流程。提供端到端集成步骤、参数配置和监控要点，确保高效准确的结构化输出。

### [领域特定数据集上微调 PaddleOCR：转移学习与增强策略](/posts/2025/10/19/fine-tune-paddleocr-on-domain-specific-datasets/)
- 日期: 2025-10-19T14:16:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对医疗表单或发票等专业文档，利用转移学习和数据增强微调 PaddleOCR 模型，提升文本提取精度。详述数据准备、训练参数配置及工程实践要点。

### [Pathway 中实现动态 Schema 演进：流式 ETL 无重启列添加与类型变更](/posts/2025/10/19/dynamic-schema-evolution-in-pathway-for-streaming-etl/)
- 日期: 2025-10-19T14:06:25+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Pathway 框架中动态 Schema 演进机制，实现流式 ETL 中无缝列添加和类型变更，支持自适应 LLM 管道，避免重启中断。

### [在 Jupyter 中利用 Claude Cookbooks 实现多轮链式思考提示工程](/posts/2025/10/19/leveraging-claude-cookbooks-in-jupyter-for-multi-turn-chain-of-thought-prompting/)
- 日期: 2025-10-19T13:47:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Claude Cookbooks 在 Jupyter 环境中构建多轮对话代理，通过链式思考提示提升推理可靠性，提供结构化推理路径的参数配置与状态管理策略。

### [使用 TypeScript 集成 DeepChat 与本地日历、邮件和文件 API 构建隐私优先的个人 AI 助手](/posts/2025/10/19/integrating-deepchat-with-local-calendar-email-and-file-apis-using-typescript-for-privacy-focused-personal-ai-assistants/)
- 日期: 2025-10-19T12:01:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向隐私需求，介绍 DeepChat 的 MCP 协议与本地数据源的 TypeScript 集成方法，包括 API 连接参数、安全监控和落地清单。

### [ResNet 中实现身份跳跃连接以训练超深网络](/posts/2025/10/19/implement-identity-skip-connections-resnet-deep-training/)
- 日期: 2025-10-19T10:32:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过身份快捷连接在CNN块中传播梯度，缓解退化问题，实现152层ResNet训练的工程化指南。

### [实现AI训练数据集自动偏见检测的可扩展管道](/posts/2025/10/19/implementing-scalable-pipelines-for-automated-bias-detection-in-ai-training-datasets/)
- 日期: 2025-10-19T10:17:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用统计指标和ML审计构建自动化管道，检测训练数据偏见，解决人类识别局限，确保公平AI模型部署。

### [Coral NPU 中 TensorFlow Lite 的内核融合与动态量化优化：1W 功率下实时边缘推理](/posts/2025/10/19/kernel-fusion-and-dynamic-quantization-in-tensorflow-lite-for-coral-npu-real-time-edge-inference-under-1w-power/)
- 日期: 2025-10-19T08:06:16+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对边缘设备低功耗需求，介绍在 TensorFlow Lite 中应用内核融合与动态量化优化 Coral NPU 的张量管道，实现 1W 功率下的实时推理参数与工程实践。

### [在 Coral NPU 上部署自定义量化 TFLite 模型实现 IoT 亚 10ms 推理](/posts/2025/10/19/deploy-custom-quantized-tflite-on-coral-npu-for-iot/)
- 日期: 2025-10-19T06:16:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 IoT 场景，介绍自定义 TFLite 模型量化部署到 Coral NPU 的工程实践，包括 Edge TPU 编译器优化内存与功耗的关键参数。

### [使用 Coral NPU 构建全栈边缘 AI 解决方案](/posts/2025/10/19/building-full-stack-edge-ai-solutions-with-coral-npu/)
- 日期: 2025-10-19T05:31:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 集成 Coral NPU 的硬件加速与软件工具，实现低功耗嵌入式设备的边缘 AI 推理，提供工程参数与部署指南。

### [使用 Coral NPU 部署边缘 AI 解决方案：TensorFlow Lite 硬件加速与集成](/posts/2025/10/19/deploying-coral-npu-edge-ai-with-tensorflow-lite/)
- 日期: 2025-10-19T04:16:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Google Coral Edge TPU 的全栈边缘 AI 部署指南，涵盖优化推理、硬件集成及 TensorFlow Lite 参数配置。

### [从零构建 26M GPT 训练管道：自定义分词器、高效数据加载与单 GPU 评估循环](/posts/2025/10/19/building-minimal-pytorch-pipeline-for-26m-gpt-training-from-scratch/)
- 日期: 2025-10-19T04:06:19+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 MiniMind，介绍单 GPU 从零训练小型 GPT 的核心实现，包括 tokenizer 训练、数据管道和评估机制。

### [使用 Pathway 实现 LLM 管道中的实时 Schema 演化](/posts/2025/10/19/real-time-schema-evolution-in-llm-pipelines-with-pathway/)
- 日期: 2025-10-19T02:06:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Pathway 框架如何通过动态 Schema 构建和验证机制处理演化的 LLM 数据格式，确保流式 ETL 管道的鲁棒性，提供工程化参数和监控要点。

### [构建电子书到有声书的自动化管道：集成语音克隆 TTS 支持多语言个性化合成](/posts/2025/10/19/ebook2audiobook-voice-cloning-tts-pipeline/)
- 日期: 2025-10-19T01:31:42+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文探讨如何使用 ebook2audiobook 工具构建自动化管道，将电子书转换为支持 1100+ 语言的个性化有声书。通过集成 XTTSv2 等 TTS 模型和语音克隆技术，实现脚本化提取、合成与章节管理，提供工程参数与最佳实践。

### [Integrating MCP Java SDK with Spring AI for Multi-Model Orchestration](/posts/2025/10/19/integrating-mcp-java-sdk-with-spring-ai-for-multi-model-orchestration/)
- 日期: 2025-10-19T01:16:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文探讨 MCP Java SDK 与 Spring AI 的集成方法，用于构建标准化 AI 客户端和服务器，支持多模型协调、工具调用及安全上下文共享，提供工程化配置和最佳实践。

### [AI代理十年级验证监督：多步验证与混合人-AI监督策略](/posts/2025/10/19/decade-scale-verification-oversight-for-ai-agents/)
- 日期: 2025-10-19T00:06:27+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨AI代理可靠性十年级工程策略，聚焦多步验证、混合人-AI监督及系统规划挑战，提供可落地参数与监控要点。

### [无服务器 PaddleOCR 管道：实时多语言 OCR 部署](/posts/2025/10/19/serverless-paddleocr-multilingual-ocr-pipeline/)
- 日期: 2025-10-19T00:01:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 PaddleOCR 构建无服务器管道，实现 PDF 和图像的实时多语言 OCR，输出结构化数据供 LLM 摄取，优化低延迟参数与部署策略。

### [AI代理混合监督验证协议设计：多步规划中的可扩展循环与错误界定](/posts/2025/10/18/hybrid-oversight-verification-for-ai-agents/)
- 日期: 2025-10-18T23:16:53+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对多步AI代理规划，设计人类-AI混合监督协议，强调可扩展验证循环、错误界定机制及工程参数，实现可靠性提升。

### [使用 Pathway 构建 RAG 系统的流式向量同步管道](/posts/2025/10/18/building-streaming-vector-sync-with-pathway-for-rag/)
- 日期: 2025-10-18T22:06:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 RAG 系统，利用 Pathway 实现实时向量嵌入更新与去重，提供增量 ETL 管道配置与监控要点。

### [使用 Pathway 构建 LLM 编排的流式 ETL 管道：实时摄取与故障容错](/posts/2025/10/18/use-pathway-for-streaming-etl-in-llm-orchestration/)
- 日期: 2025-10-18T21:16:48+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Pathway 框架实现 LLM 编排中的流式 ETL，涵盖实时数据摄取、转换、分布式模型同步，提供低延迟输出和容错机制的参数配置与监控要点。

### [动手实践大型语言模型：使用 Jupyter 笔记本实现端到端工作流](/posts/2025/10/18/hands-on-llm-end-to-end-workflows-with-jupyter-notebooks/)
- 日期: 2025-10-18T21:01:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 O'Reilly 的《Hands-On Large Language Models》书籍代码库，通过 Jupyter 笔记本实现 LLM 的 fine-tuning、RAG 集成和部署，提供实用参数和监控要点。

### [使用 DeepChat 构建个人数据集成 AI 助手：日历、邮件与文件的安全链接](/posts/2025/10/18/building-personal-data-ai-assistant-with-deepchat-calendar-email-files/)
- 日期: 2025-10-18T20:46:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 DeepChat 和 MCP 协议，指导集成用户日历、邮件和文件，实现上下文感知的主动 AI 交互，包括安全 API 钩子和参数配置。

### [语音克隆电子书转有声书管道：章节提取与自然叙述工程实践](/posts/2025/10/18/voice-cloned-ebook-to-audiobook-pipeline/)
- 日期: 2025-10-18T20:06:25+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于ebook2audiobook管道，给出电子书解析、TTS语音克隆及多语言支持的落地参数、监控与输出格式优化。

### [Claude API 提示工程食谱：Jupyter 笔记本中的链式思考、少样本适应与 XML 结构化输出](/posts/2025/10/18/claude-prompt-engineering-jupyter-cookbooks-cot-few-shot-xml/)
- 日期: 2025-10-18T19:01:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 Jupyter 笔记本演示 Claude API 的提示工程技巧，包括链式思考、少样本适应和 XML 结构化输出，实现 robust AI 任务编排。提供可复制代码和最佳实践参数。

### [在 Open Notebook 中集成 Tortoise-TTS 实现自定义语音克隆](/posts/2025/10/18/integrate-tortoise-tts-voice-cloning-open-notebook/)
- 日期: 2025-10-18T18:09:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 Open Notebook 中集成 Tortoise-TTS，用于自定义语音克隆，支持个性化多格式播客生成与低延迟合成。

### [基于视觉的Skyvern自适应网页抓取：元素检测与故障恢复](/posts/2025/10/18/vision-based-adaptive-scraping-with-skyvern/)
- 日期: 2025-10-18T15:46:48+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用视觉语言模型实现Skyvern的动态JS站点抓取，聚焦无固定选择器的元素检测、自适应导航及故障恢复策略。

### [使用 PyTorch DDP 将 MiniMind 的 26M GPT 训练扩展到多 GPU 集群：数据分片、梯度同步与弹性检查点](/posts/2025/10/18/scaling-minimind-26m-gpt-training-to-multi-gpu-clusters-with-pytorch-ddp/)
- 日期: 2025-10-18T14:06:22+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何通过 PyTorch DDP 将 MiniMind 26M 参数 GPT 模型训练扩展到多 GPU 环境，包括数据分片、梯度 all-reduce 机制，以及弹性检查点实现故障容忍。

### [AI 代理的十年级系统挑战：可靠性和监督](/posts/2025/10/18/decade-scale-challenges-in-ai-agents-reliability-and-oversight/)
- 日期: 2025-10-18T13:47:00+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Karpathy 访谈，剖析 AI 代理十年级可靠性难题，聚焦多步规划验证阈值与混合人类-AI 监督集成，提供工程参数与监控要点。

### [在 MiniMind 中集成 FP16 混合精度训练：加速 26M GPT 原型在消费级 GPU 上的开发](/posts/2025/10/18/integrate-fp16-mixed-precision-training-minimind/)
- 日期: 2025-10-18T13:31:48+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 MiniMind 的 PyTorch 训练循环，给出 FP16 混合精度集成、AMP 配置与损失缩放的工程实践与稳定性监控要点。

### [PaddleOCR 输出链式接入 LLM：扫描文档表格结构化提取与后处理优化](/posts/2025/10/18/paddleocr-llm-chaining-structured-table-extraction/)
- 日期: 2025-10-18T12:16:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨将 PaddleOCR 输出链式输入 LLM，实现扫描文档中表格的结构化提取，包括实体解析和噪声输入错误校正，提供工程参数与监控要点。

### [AI 代理十年规模系统性挑战：多步规划可靠性验证与混合监督架构](/posts/2025/10/18/decade-scale-systemic-issues-in-ai-agents-reliability-verification/)
- 日期: 2025-10-18T12:01:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 分析 AI 代理在十年尺度上的系统性难题，聚焦多步规划的可靠性验证机制及可扩展混合监督架构的设计要点与落地参数。

### [使用 WebMCP 构建浏览器原生 MCP 客户端](/posts/2025/10/18/building-browser-native-mcp-client-with-webmcp/)
- 日期: 2025-10-18T11:46:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 WebMCP 如何实现无服务器中介的多模型 AI 工具集成，提供工程化构建指南与安全参数。

### [桥接 PaddleOCR 与 LLM：PDF 结构化数据提取](/posts/2025/10/18/bridge-paddleocr-to-llms-for-pdf-structured-extraction/)
- 日期: 2025-10-18T11:16:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 PaddleOCR 输出桥接到 LLM，实现多语言 PDF 的结构化提取，支持验证与错误修正的工程化管道。

### [AI代理多步规划可靠性：验证循环与混合人-AI监督实现](/posts/2025/10/18/ai-agents-multi-step-planning-reliability-verification-hybrid-oversight/)
- 日期: 2025-10-18T10:46:57+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对生产环境中AI代理的多步执行，提出验证循环机制与混合人-AI监督策略，减少幻觉传播风险，提供参数阈值与监控清单。

### [MiniMind：从零用 PyTorch 构建 26M GPT 核心训练组件](/posts/2025/10/18/minimal-pytorch-gpt-training-core-components/)
- 日期: 2025-10-18T10:16:53+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 MiniMind 中 PyTorch 实现的 Transformer 架构、分词器、数据管道及训练循环，为小规模 GPT 训练提供工程化指导。

### [工程可靠AI代理：Karpathy眼中的多步规划与错误积累挑战](/posts/2025/10/18/engineering-reliable-ai-agents-karpathy-challenges/)
- 日期: 2025-10-18T10:01:43+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨AI代理可靠性工程，聚焦多步规划、错误积累与工具集成，提供可落地参数与策略。

### [Patterns from Leaked GPTs Prompts for Multi-Turn Agents](/posts/2025/10/18/patterns-from-leaked-gpts-prompts-for-multi-turn-agents/)
- 日期: 2025-10-18T08:06:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 提取泄露 GPTs 提示中的核心模式，聚焦多轮代理的角色、工具与安全设计，提供可复用模板。

### [Claude Skills 与 MCP 协议比较：构建高效 AI 代理的原生集成 vs 多模型标准化](/posts/2025/10/18/comparing-claude-skills-and-mcp-for-efficient-ai-agents/)
- 日期: 2025-10-18T07:46:36+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 比较 Claude Skills 的原生工具集成和推理链与 MCP 的多模型协议，在无需外部编排下构建高效 AI 代理，突出集成简易性和工程参数。

### [使用 nanoGPT 构建中型 GPT 微调管道：自定义 PyTorch 循环、LoRA 集成与多 GPU 分布式训练](/posts/2025/10/18/building-finetuning-pipelines-for-medium-gpts-with-nanogpt-lora-and-multi-gpu/)
- 日期: 2025-10-18T07:16:28+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文探讨如何利用 nanoGPT 框架高效微调中型 GPT 模型，包括自定义 PyTorch 训练循环的转移学习设置、LoRA 适配器的集成，以及多 GPU 分布式训练的工程实践。提供可落地参数配置和监控要点，帮助开发者在领域特定数据集上快速适配模型。

### [使用 Claude Code 构建 Reddit 情感分析仪表板：与 Codex 的速度与准确性比较](/posts/2025/10/18/building-real-time-sentiment-dashboard-claude-code-reddit-vs-codex/)
- 日期: 2025-10-18T06:46:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Claude Code 快速生成代码，实现 Reddit 评论的实时情感分析仪表板，包括 API 集成和 Streamlit 可视化，并对比其在开发速度和分析准确性上与 Codex 的表现。

### [Kronos 金融分词融合：整合 Tick 数据与新闻嵌入](/posts/2025/10/18/kronos-financial-tokenization-fusion-tick-news/)
- 日期: 2025-10-18T06:06:15+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 为领域特定金融 LLM 设计融合高频 Tick 数据与新闻嵌入的分词器，处理序列长度与语义对齐，提供工程参数、实现清单与监控要点。

### [缓解AI工程中的货物崇拜：通过可重复基准和模块化管道实现实证验证](/posts/2025/10/18/mitigating-cargo-cult-in-ai-engineering-empirical-validation/)
- 日期: 2025-10-18T05:16:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: AI工程中常见的货物崇拜实践往往导致表面优化而无实质性能提升。本文通过可重复基准测试、模块化管道和实证架构测试，提供实用策略，确保真实性能获益。

### [使用 MiniMind 快速原型化 GPT 模型：单 GPU 2 小时训练 26M 参数](/posts/2025/10/18/rapid-gpt-prototyping-with-minimind/)
- 日期: 2025-10-18T05:01:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向单 GPU 环境，给出 MiniMind 框架下自定义 tokenizer、梯度累积与动态批处理的 PyTorch 训练管道参数与优化要点。

### [Skyvern：利用视觉模型与 LLM 规划构建 AI 爬虫](/posts/2025/10/18/skyvern-ai-scraper-builder/)
- 日期: 2025-10-18T04:46:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Skyvern 如何通过自然语言工程化 AI 代理生成 web 爬虫，聚焦视觉 UI 交互与动态数据提取的参数与实践。

### [在 Chromium 中嵌入 MCP 服务器：浏览器端多模型 AI 协议执行](/posts/2025/10/18/browseros-ai-mcp-browser-embedding/)
- 日期: 2025-10-18T04:01:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 BrowserOS 如何在浏览器环境中嵌入 MCP 服务器，实现客户端侧的多模型 AI 执行、工具调用与上下文管理，提供工程化参数与最佳实践。

### [Claude 工具使用技能与 MCP 多模型方法的对比：生产工作流集成优势](/posts/2025/10/18/claude-tool-use-vs-mcp-multi-model-integration/)
- 日期: 2025-10-18T03:16:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 评估Claude的工具使用技能在可靠AI代理编排中的作用，与MCP的多模型方法对比，突出生产工作流中的集成优势。提供工程参数和监控要点。

### [构建简易 PyTorch 从零 GPT 训练代码库：核心架构、数据加载与评估循环](/posts/2025/10/18/building-minimal-pytorch-codebase-for-from-scratch-gpt-training-core-architecture-data-loading-and-evaluation-loops/)
- 日期: 2025-10-18T01:31:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于nanoGPT，介绍简化的GPT训练实现，强调核心组件的可移植性和易调试性。

### [逆向工程泄露的 GPTs 系统提示：实现自定义多轮代理](/posts/2025/10/18/reverse-engineering-leaked-gpts-prompts-for-custom-multi-turn-agents/)
- 日期: 2025-10-18T00:06:10+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于泄露提示逆向工程，指导实现多轮对话代理，包括角色扮演、工具调用与安全机制。

### [Kronos 金融市场基础模型预训练管道工程：领域特定分词化](/posts/2025/10/17/engineering-pretraining-pipelines-for-kronos-financial-market-foundation-model/)
- 日期: 2025-10-17T23:31:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对金融时序数据，工程化 Transformer LLM 的预训练管道，使用领域特定分词建模市场动态并预测波动模式，提供可落地参数与实现清单。

### [构建最小 PyTorch 管道：2 小时训练 26M GPT 从零开始](/posts/2025/10/17/build-minimal-pytorch-pipeline-26m-gpt-training/)
- 日期: 2025-10-17T22:31:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 使用 MiniMind 框架，从零构建高效训练管道，实现 26M 参数 GPT 模型在 2 小时内的训练，强调可操作参数和监控要点。

### [Building Multi-Model AI Pipelines with MCP Java SDK](/posts/2025/10/17/building-multi-model-ai-pipelines-with-mcp-java-sdk/)
- 日期: 2025-10-17T22:16:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在Spring Boot应用中使用MCP Java SDK实现多模型AI管道，焦点在上下文传播、请求响应处理及安全模型间通信，提供工程化参数和最佳实践。

### [AI 生成代码占比 250% 的工程影响：生产力度量、质量风险与人机协作策略](/posts/2025/10/17/ai-generated-codebase-250-percent-engineering-implications/)
- 日期: 2025-10-17T21:16:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 AI 生成代码达 250% 的工程含义，包括生产力提升测量、代码质量退化风险，以及大规模开发中人机协作策略。

### [金融市场数据预训练管道工程：K线分词、领域嵌入与可扩展Transformer架构](/posts/2025/10/17/engineering-pretraining-pipelines-financial-market-data/)
- 日期: 2025-10-17T21:01:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨Kronos模型在金融市场数据预训练中的工程实践，包括K线数据的分词策略、领域特定嵌入设计以及Transformer架构的扩展性，实现市场语言理解。

### [Kronos: Pretraining a Foundation Model for Financial Market Language](/posts/2025/10/17/kronos-pretraining-a-foundation-model-for-financial-market-language/)
- 日期: 2025-10-17T20:06:10+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Kronos 项目在金融 K-line 数据上的预训练方法，包括 tokenizer 设计、数据处理和预测应用，提供工程化参数与落地指南。

### [构建开源 Notebook LM 克隆：灵活音频合成与多格式播客生成管道](/posts/2025/10/17/building-open-notebook-lm-clone-flexible-audio-synthesis-multi-format-podcast-pipelines/)
- 日期: 2025-10-17T19:46:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探索 Open Notebook 项目，聚焦于实现灵活的音频合成、多格式播客生成以及可扩展的多模态处理管道的工程实践与参数配置。

### [使用 PaddleOCR 构建多语言 OCR 管道](/posts/2025/10/17/building-multilingual-ocr-pipeline-with-paddleocr/)
- 日期: 2025-10-17T18:46:22+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 100+ 语言的 PDF/图像 OCR 引擎构建，集成 LLM 的优化 tokenization 与后处理参数指南。

### [Claude Agent Skills API 多轮编排防护栏工程化](/posts/2025/10/17/multi-turn-guardrails-claude-agent-skills-api/)
- 日期: 2025-10-17T18:17:22+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 工程化 Claude Agent Skills API 中的多轮防护栏，实现动态工具编排的状态一致性、滥用预防与错误恢复，适用于扩展代理工作流。

### [工程化实时宠物视觉管道：使用边缘AI和云流式传输进行宠物活动检测](/posts/2025/10/17/engineering-real-time-pet-vision-pipeline-edge-ai-cloud-streaming/)
- 日期: 2025-10-17T18:06:11+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对宠物活动检测，设计边缘AI实时视觉管道与云流式传输，实现低延迟交互监控，提供工程参数和优化策略。

### [客户端逆向工程检测 Gemini 3.0 A/B 测试变体：JS 钩子和网络负载分析](/posts/2025/10/17/reverse-engineering-client-side-detection-gemini-3-0-ab-variants/)
- 日期: 2025-10-17T15:32:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过浏览器开发者工具逆向客户端 JS 钩子和网络负载，检测生产环境中未公开的 Gemini 3.0 A/B 变体，提供无 API 访问的外部监控参数与监控要点。

### [客户端 JavaScript 钩子检测 Gemini 3.0 A/B 测试变体](/posts/2025/10/17/client-side-javascript-hooks-for-gemini-3-0-ab-detection/)
- 日期: 2025-10-17T14:31:30+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨使用 JS 钩子在客户端检测 Gemini 3.0 特征，支持本地日志、变体识别和性能分析，无需服务器依赖。

### [使用自愈 DOM 构建有状态浏览器代理：处理动态 UI 的持久状态与重放机制](/posts/2025/10/17/self-healing-dom-for-stateful-browser-agents/)
- 日期: 2025-10-17T14:17:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 构建使用自愈 DOM 映射的有状态浏览器代理，实现弹性 web 自动化，通过持久状态和重放机制应对动态 UI 变化。提供工程化参数和监控要点。

### [Gemini 3.0 rollout 的客户端侧 A/B 测试变体检测](/posts/2025/10/17/client-side-ab-detection-for-gemini-3-0-rollout/)
- 日期: 2025-10-17T13:31:43+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 实现客户端启发式检测 Gemini 3.0 rollout 的 A/B 测试变体，分析响应模式和特征标志，无需后端访问。

### [浏览器代理中自愈 DOM 模糊匹配工程：Levenshtein 距离与重放缓冲区](/posts/2025/10/17/engineering-self-healing-dom-fuzzy-matching-in-browser-agents-with-levenshtein-distance-and-replay-buffers/)
- 日期: 2025-10-17T13:01:40+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向浏览器代理的自愈机制，给出基于 Levenshtein 距离的 DOM 模糊匹配与重放缓冲区状态维护的工程参数与实现要点。

### [Claude Skills API 中安全多工具协调：运行时守卫与错误恢复](/posts/2025/10/17/secure-multi-tool-orchestration-in-claude-skills-api/)
- 日期: 2025-10-17T12:31:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向企业 AI 代理工作流，给出 Claude Skills API 中安全多工具协调的运行时守卫、错误恢复和权限范围参数与监控要点。

### [Gemini 3.0 A/B测试实验设计：用户分段、指标选择与统计验证](/posts/2025/10/17/gemini-3-0-ab-testing-experiment-design/)
- 日期: 2025-10-17T12:03:20+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对Gemini 3.0模型上线，详解A/B测试中的用户分段策略、客观指标选取与统计功效验证方法，避免常见实验陷阱。

### [Qwen3-VL 中动态视觉标记优化的实践：自适应裁剪、分辨率缩放与量化](/posts/2025/10/17/optimizing-dynamic-vision-tokenization-in-qwen3-vl/)
- 日期: 2025-10-17T11:32:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 Qwen3-VL 中，通过自适应裁剪、分辨率缩放和量化优化动态视觉标记，实现高效的边缘部署和实时多模态推理。详细参数设置和监控策略，确保性能与准确性的平衡。

### [Qwen3-VL 中动态视觉分词的工程化实践：自适应处理变分辨率图像](/posts/2025/10/17/engineering-dynamic-vision-tokenization-in-qwen3-vl/)
- 日期: 2025-10-17T11:18:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Qwen3-VL 的动态视觉分词机制，通过像素预算控制实现高效的多模态推理预处理，避免固定裁剪带来的信息丢失与计算浪费，提供参数配置与优化建议。

### [集成 Claude Tool Use API 实现多轮代理工作流：工具链、状态持久与错误恢复](/posts/2025/10/17/integrate-claude-tool-use-multi-turn-agent-workflows/)
- 日期: 2025-10-17T10:48:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在对话 AI 系统中集成 Claude Tool Use API，聚焦多轮工具链、状态管理和错误恢复，提供工程化参数与最佳实践。

### [在 SWE-Grep 的 RL 驱动多轮检索中实现缓存层和实时去重](/posts/2025/10/17/implementing-caching-layers-real-time-deduplication-swe-grep-rl-multi-turn-retrieval/)
- 日期: 2025-10-17T10:18:12+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 SWE-Grep 的多模型流式输出，给出 RL 驱动检索的缓存管理和去重工程化参数与监控要点。

### [Qwen3-VL中视觉-语言grounding的工程实现](/posts/2025/10/17/engineering-vision-language-grounding-in-qwen3-vl/)
- 日期: 2025-10-17T10:04:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨Qwen3-VL中使用交错分词、位置嵌入和跨模态注意力机制实现视觉-语言grounding的工程方法，提供图像-文本对齐的关键参数与实践清单。

### [Claude Skills API 运行时护栏实现：输入验证、错误恢复与安全工具链](/posts/2025/10/17/implementing-runtime-guardrails-for-claude-skills-api/)
- 日期: 2025-10-17T09:32:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 Claude Tool Use API 在生产 AI agents 中的应用，提供运行时输入验证、错误恢复机制及安全工具链的参数配置与监控要点，提升系统可靠性和安全性。

### [Gemini 3.0 rollout 的 A/B 测试管道实现：流量分割、实时监控与回退机制](/posts/2025/10/17/implementing-ab-testing-pipelines-for-gemini-3-0-rollout/)
- 日期: 2025-10-17T09:18:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 Gemini 3.0 的生产 rollout，探讨 A/B 测试管道的构建，重点包括流量分割策略、实时推理监控要点，以及 fallback 机制，确保模型稳定暴露。

### [Waymo 与 DoorDash 自动驾驶配送 API 集成工程实践](/posts/2025/10/17/waymo-doordash-autonomous-delivery-api-orchestration/)
- 日期: 2025-10-17T09:04:52+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Waymo 自动驾驶车队与 DoorDash 物流系统的 API 集成，实现实时订单分配、动态路由、安全交接和错误恢复的工程参数与协议。

### [Anthropic 交互式 CoT 与 Few-Shot 提示工程教程](/posts/2025/10/17/anthropic-interactive-cot-fewshot-tutorial/)
- 日期: 2025-10-17T08:50:36+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 Anthropic 的 Jupyter 教程框架，构建掌握 Claude 模型 CoT 推理、few-shot 任务适应和 XML 结构化输出的互动练习，提供工程化参数与最佳实践。

### [使用 EXO 1.0 优化 LLM 推理管道：DGX Spark 与 Mac Studio 的异构加速](/posts/2025/10/17/optimizing-llm-inference-with-exo-1-0-on-dgx-spark-and-mac-studio/)
- 日期: 2025-10-17T08:02:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 EXO 1.0 在 Nvidia DGX Spark 和 Apple Mac Studio 上优化 LLM 推理的策略，实现 2.8 倍速度提升和低延迟服务。

### [Inkeep 视觉代理构建器：RAG 检索、工具集成与多模态输入的工程实践](/posts/2025/10/17/inkeep-visual-agent-builder-rag-tools-multimodal/)
- 日期: 2025-10-17T07:32:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Inkeep YC 支持的平台中，工程化视觉拖拽和代码接口构建 AI 代理的实践，包括 RAG 检索、工具集成及多模态处理参数。