# 分类：ai-systems

> 该分类下的文章按时间倒序排列，便于按主题继续深挖。

## 页面摘要
- 路径: /categories/ai-systems/page/41/
- 当前页: 41 / 75
- 文章总数: 5960
- 当前页文章数: 80

## 快速导航
- [首页](/)
- [分类索引](/categories/)
- [归档索引](/archive/)

## 本页文章
### [工程化运行时护栏：评估管道与检查点恢复框架](/posts/2025/11/29/engineering-runtime-guardrails-evaluation-pipelines-checkpoint-recovery/)
- 日期: 2025-11-29T17:33:40+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对长运行AI代理，构建运行时护栏、评估管道及检查点恢复harnesses，实现超出基本恢复的规模化可靠性，提供阈值参数、监控清单。

### [Twilio 流式 STT/TTS 通话代理：对话状态管理与重连机制](/posts/2025/11/29/twilio-streaming-stt-tts-conversation-state-in-call-center-ai/)
- 日期: 2025-11-29T17:18:08+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Twilio Media Streams 构建实时 STT/TTS 语音代理，给出 WebSocket 对话状态持久化、重连循环及关键参数配置。

### [ADK-Go 代理评估管道：工具调用与结构化测试实现](/posts/2025/11/29/agent-evaluation-pipelines-adk-go/)
- 日期: 2025-11-29T16:49:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 ADK-Go Go SDK，构建 AI 代理工具调用评估管道，提供轨迹验证、响应质量评分及可靠性指标配置参数。

### [VERL 中多 GPU 分片 PPO：数据/模型并行、梯度同步与超越 DDPPO 的扩展性](/posts/2025/11/29/multi-gpu-sharding-kl-regularized-ppo-verl-rlhf/)
- 日期: 2025-11-29T16:07:25+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: VERL 框架下 KL 正则化 PPO 的多 GPU 分片策略，包括 FSDP/Megatron 并行、3D-HybridEngine resharding 和高效梯度同步，实现 offline RLHF 高扩展性。

### [Anthropic 长运行 Agent 有效 Harness：运行时检查点与故障恢复工程实践](/posts/2025/11/29/effective-harnesses-for-long-running-agents-checkpoint-recovery/)
- 日期: 2025-11-29T16:03:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 借鉴 Anthropic 实践，实现长运行 AI Agent 的检查点机制、故障恢复和监控框架。通过 Git、进度文件和功能清单，确保跨会话稳定进展。

### [精选 4300+ 开源 n8n 工作流 JSON 模板：构建代理 AI 管道、API 链与数据 ETL](/posts/2025/11/29/curate-4300-open-source-n8n-workflows-json-templates-agentic-ai-pipelines-etl/)
- 日期: 2025-11-29T15:33:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Zie619/n8n-workflows 仓库，整理 4343 个生产就绪模板，支持 JSON 导入 n8n 快速组装代理 AI 管道、ETL 链路，内置错误重试、并行执行与 Docker 导出参数。

### [Memori：多代理 LLM 系统中的日志结构化合并树持久化记忆层](/posts/2025/11/29/memori-log-structured-merge-multi-agent-memory-layers/)
- 日期: 2025-11-29T14:18:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 借鉴 LSM 树思想，Memori 实现多代理 LLM 的可扩展持久化分层记忆，提供 compaction 参数、检索阈值与多代理协作清单。

### [LightRAG 双图索引下的无 LLM 查询融合与蒸馏实践](/posts/2025/11/29/lightrag-query-fusion-distillation-dual-graph/)
- 日期: 2025-11-29T14:07:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双层图索引实现 LLM-free 查询融合与知识蒸馏，提供低资源高效 RAG，详解参数配置、落地清单与监控要点。

### [本地 RAG：多嵌入器混合检索与动态融合重排](/posts/2025/11/29/local-rag-hybrid-retrieval-with-multi-embedders/)
- 日期: 2025-11-29T10:35:42+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本地 RAG 栈中，使用 Ollama/nomic 等多嵌入器实现关键词+向量混合检索、动态融合与重排，优化分块以提升无云精准召回。

### [本地 RAG 检索去重：近似重复度量与动态阈值调优](/posts/2025/11/29/local-rag-retrieval-dedup-dynamic-thresholds/)
- 日期: 2025-11-29T09:48:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本地 RAG 系统中，针对检索结果的近重复去重，使用嵌入相似度指标与动态阈值策略，配置参数与监控要点，减少上下文冗余引发幻觉。

### [LightRAG 双图索引查询融合权重调优与低资源蒸馏实践](/posts/2025/11/29/lightrag-dual-graph-query-fusion-weight-tuning-and-low-resource-distillation-practice/)
- 日期: 2025-11-29T09:03:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 双图索引下查询融合权重调优与蒸馏实践，实现低资源场景高效召回与精度提升。

### [构建28M HN评论向量嵌入搜索数据集：ClickHouse工程实践](/posts/2025/11/29/building-28m-hn-comments-vector-embedding-search-dataset-clickhouse/)
- 日期: 2025-11-29T08:04:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 详解ClickHouse上28M Hacker News评论数据集构建：爬取清洗、批量嵌入生成、HNSW索引与相似度查询基准，提供可复现参数。

### [API驱动电话机器人集成：实时语音交互与呼叫中心自动化](/posts/2025/11/29/api-driven-phone-bot-integration/)
- 日期: 2025-11-29T07:47:57+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Microsoft Call Center AI，通过 API 发起 AI 代理电话，实现实时语音流处理与呼叫中心自动化的工程参数与监控要点。

### [LLM 调试简单 JS Bug 的提示工程策略：CoT、工具与迭代精炼](/posts/2025/11/29/llm-debugging-simple-js-bugs-prompting-strategies-with-cot-tools-and-iteration/)
- 日期: 2025-11-29T07:33:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于真实案例，探讨 CoT、工具调用与迭代提示策略如何暴露 LLM 在简单 JS bug 定位中的局限，并构建鲁棒代码调试管道。

### [LightRAG 双图索引与查询融合：阈值选择与工程参数](/posts/2025/11/29/lightrag-dual-graph-indexing-query-fusion/)
- 日期: 2025-11-29T05:18:20+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 双图索引构建知识图，查询融合 hybrid 模式参数调优，实现低资源高效 RAG，提升复杂查询精度。

### [LLM生产反模式：构建鲁棒管道的验证、重试与路由策略](/posts/2025/11/29/llm-production-anti-patterns-robust-pipelines/)
- 日期: 2025-11-29T04:18:40+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 工程化LLM管道，避免提示脆弱、上下文溢出、输出不一致，通过验证层、重试逻辑和混合模型路由实现鲁棒性。

### [用 ADK-Go 构建工具调用 AI 代理：多代理协作与部署参数指南](/posts/2025/11/29/adk-go-ai-agents-toolkit-code-first-go-sdk/)
- 日期: 2025-11-29T04:07:10+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 代码优先的 Go SDK ADK-Go，用于 AI 代理的工具调用、多代理协作、评估与部署控制的最佳实践参数。

### [Anthropic 长运行 Agent 可靠支架实现：自动回滚、评估驱动恢复与故障分类](/posts/2025/11/29/anthropic-long-running-agent-harnesses/)
- 日期: 2025-11-29T03:34:51+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Anthropic Claude Agent SDK，构建长运行 Agent 的工程化支架，包括双 Agent 架构、Git 回滚、JSON 评估循环与常见故障模式处理参数。

### [将 28M HN 评论导入 ClickHouse：原生 ANN 索引的语义搜索实践](/posts/2025/11/29/ingest-28m-hn-comments-into-clickhouse-for-vector-search/)
- 日期: 2025-11-29T02:32:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 28M HN 评论数据集，利用 ClickHouse 原生 ANN 索引实现高效向量嵌入语义搜索，给出表设计、索引参数与 SQL 查询优化要点。

### [通过分数蒸馏采样、高斯溅射和可微网格优化的文本到3D网格生成](/posts/2025/11/29/text-to-3d-meshes-score-distillation-gaussian-splatting-differentiable-optimization/)
- 日期: 2025-11-29T02:19:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 工程化文本条件3D网格生成管道：SDS指导下高斯溅射表示结合可微优化，实现高质量可编辑3D资产的关键参数与监控要点。

### [LLM驱动PCB网表分析自动检测原理图错误：netlist.io工程参数](/posts/2025/11/29/llm-pcb-netlist-schematic-error-detection/)
- 日期: 2025-11-29T01:48:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用LLM解析KiCad/Altium网表与数据手册，自动识别缺失连接、无效元件等原理图错误，提供prompt模板、置信阈值与验证清单。

### [本地RAG工程实践：嵌入模型选型、向量DB搭建与幻觉优化](/posts/2025/11/29/local-rag-engineering-embedding-selection-vector-db-setup-hallucination-mitigation/)
- 日期: 2025-11-29T01:33:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 自托管RAG系统工程指南：BGE嵌入部署、Chroma/FAISS向量库、检索融合与幻觉缓解参数。

### [TrendRadar 无代码 Docker 部署与多渠道推送实现](/posts/2025/11/29/no-code-docker-deployment-and-multi-channel-push-for-trendradar/)
- 日期: 2025-11-29T00:08:29+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: TrendRadar 30s Docker 一键部署，多平台热点聚合与 AI 分析，支持企业微信/飞书/Telegram/ntfy 等多渠道推送的关键参数与配置清单。

### [LightRAG 查询融合中的 Chunk 阈值调优与蒸馏权重实践](/posts/2025/11/28/lightrag-query-fusion-chunk-thresholds-distillation/)
- 日期: 2025-11-28T21:18:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG低资源RAG场景下，query fusion的chunk thresholds调优参数与distillation权重设置，实现高效融合检索与资源优化。

### [LightRAG 查询融合与模型蒸馚：低资源 RAG 的块阈值与融合权重调优](/posts/2025/11/28/lightrag-query-fusion-distillation-low-resource-chunk-thresholds-fusion-weights/)
- 日期: 2025-11-28T20:49:00+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在低资源环境下，利用 LightRAG 双图索引实现查询融合与模型蒸馏，详细调优 chunk 阈值与融合权重，提升检索精度。

### [代码优先的 Go AI 代理工具包：工具调用与评估管道实战](/posts/2025/11/28/code-first-go-sdk-ai-agents-tool-calling-eval-pipelines/)
- 日期: 2025-11-28T20:10:06+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Google ADK-Go，以代码定义构建复杂 AI 代理的核心工具调用机制、评估管道配置参数，以及部署运行时灵活控制要点。

### [整合 Nari Labs Dia2 Apache 2.0 TTS 模型：低延迟流式对话音频实时推理管道与分块波形生成](/posts/2025/11/28/integrate-nari-labs-dia2-for-low-latency-streaming-tts/)
- 日期: 2025-11-28T19:19:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于Dia2构建低延迟流式TTS系统，给出prefix条件、CUDA graph优化、Mimi chunk参数与监控阈值清单。

### [LightRAG双图索引查询融合蒸馏：低资源RAG动态chunk阈值与实体优化](/posts/2025/11/28/lightrag-dual-graph-indexing-query-fusion-distillation-low-resource-rag/)
- 日期: 2025-11-28T17:48:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG通过双图索引融合local/global查询，实现低资源RAG：动态chunk阈值选择、实体关系检索阈值优化及高效部署参数清单。

### [Beads：编码代理的持久记忆升级](/posts/2025/11/28/beads-persistent-memory-upgrade-for-coding-agents/)
- 日期: 2025-11-28T16:19:25+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 为 coding agents 注入 graph-based episodic memory，通过 beads 链式 issue tracker 存储代码 diff、推理与上下文，实现无 token 重置的迭代开发。

### [Jotunn-8 神经向量流水线在 ARM SoC 低功耗推理中的工程实践](/posts/2025/11/28/jotunn-8-neurovector-pipelines-arm-low-power-inference/)
- 日期: 2025-11-28T13:34:09+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 5nm 节点，剖析 Jotunn-8 neurovector 流水线的分片策略、低功耗阈值调优及 ARM SoC 集成参数，实现高效分片推理部署。

### [TPU ICI 实现低延迟全对全集体操作：优于 NVLink 的海量多 Pod AI 训练](/posts/2025/11/28/tpu-ici-low-latency-all-to-all-collectives-outperforming-nvlink/)
- 日期: 2025-11-28T10:34:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 TPU ICI 在带宽、延迟、容错上的优势，针对海量多 Pod AI 训练提供全对全集体操作的参数阈值、融合优化与监控清单。

### [剖析 Vsora Jotunn-8 5nm 推理 SoC 的 NeuroVector 流水线设计、低功耗调度与 ARM 集成优化](/posts/2025/11/28/dissecting-vsora-jotunn-8-5nm-neurovector-pipeline-low-power-arm-integration/)
- 日期: 2025-11-28T10:19:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 聚焦欧洲首款 5nm HBM 推理 SoC，解析 NeuroVector 流水线的高吞吐机制、低功耗调度阈值及 ARM 主机集成参数，实现高效推理部署。

### [聚合 n8n Workflows 构建低代码 AI Agent 编排库：故障容错与多平台集成](/posts/2025/11/28/n8n-workflows-library-for-agentic-ai-pipelines/)
- 日期: 2025-11-28T10:07:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Zie619/n8n-workflows 库，快速组装数千开源 workflows 实现 AI agent 管道，支持 Docker 多平台部署、自动重试机制与 node-graph 监控参数。

### [LightRAG 双图查询融合与知识蒸馏优化：低资源 RAG 的 chunk 阈值选择与实体关系索引工程实践](/posts/2025/11/28/lightrag-query-fusion-distillation-low-resource-practice/)
- 日期: 2025-11-28T08:48:33+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双知识图索引与查询融合机制，结合小模型知识蒸馏优化，实现低资源场景下高效 chunk 阈值调优与实体关系索引实践，提升 RAG 检索精度与生成质量。

### [Go 语言代码优先的 AI Agent 工具包：adk-go 的构建与部署实践](/posts/2025/11/28/code-first-go-toolkit-for-ai-agents-adk-go/)
- 日期: 2025-11-28T08:07:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: adk-go 作为代码优先的 Go 工具包，支持无依赖工具调用、灵活运行时和评估流水线，给出工程参数与部署清单。

### [欧洲5nm AI推理SoC Jotunn-8：无晶圆厂设计与低功耗边缘部署工程实践](/posts/2025/11/28/jotunn-8-5nm-european-ai-inference-soc/)
- 日期: 2025-11-28T08:02:52+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析Vsora Jotunn-8的fabless设计流程、5nm自定义NPU架构与ARM集成参数，助力低功耗边缘AI推理落地。

### [KPN 滤波在猫图像生成管道中的滤波器预测与多尺度融合](/posts/2025/11/28/kpn-filtering-in-cat-image-generation-pipeline/)
- 日期: 2025-11-28T06:33:07+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 将 Kernel Prediction Network (KPN) 集成到猫图像生成管道，实现像素级滤波核预测与多尺度融合，提升生成效率与细节质量，提供落地参数。

### [VERL中KL正则化PPO的多GPU数据并行：离线RLHF偏好蒸馏与千卡扩展](/posts/2025/11/28/verl-multi-gpu-kl-ppo-offline-rlhf-parallelism/)
- 日期: 2025-11-28T06:18:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: VERL框架下KL正则化PPO的多GPU数据并行训练，支持离线RLHF偏好蒸馏，提供高效扩展到千卡规模的工程参数与监控要点。

### [TPU ICI 互连 vs NVLink：AI 集群扩展瓶颈与生态锁定工程考量](/posts/2025/11/28/tpu-ici-vs-nvlink-scaling-lockin-ai-clusters/)
- 日期: 2025-11-28T05:20:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 对比 TPU 3D Torus ICI 与 NVLink CLOS 在 AI 集群 scaling 的瓶颈与生态锁定，剖析工程选型参数及 Google 长期竞赛优势。

### [LightRAG 查询融合与知识蒸馏：低资源高效RAG工程实践](/posts/2025/11/28/lightrag-query-fusion-and-distillation-for-efficient-low-resource-rag/)
- 日期: 2025-11-28T05:04:07+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双图索引与查询融合机制，实现实体检索与关系聚合的动态融合；结合知识蒸馏优化小模型KG提取，提供低成本、高效RAG pipeline参数与部署清单。

### [verl中KL正则化PPO的多GPU数据并行离线RLHF偏好对齐蒸馏实现](/posts/2025/11/28/kl-regularized-ppo-offline-rlhf-multigpu-in-verl/)
- 日期: 2025-11-28T04:48:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 详解verl框架下KL-regularized PPO的多GPU数据并行配置，用于离线RLHF偏好对齐蒸馏，提供工程参数清单、监控要点与稳定性优化策略。

### [DeepSeekMath-V2：通过多阶段验证生成实现自验证数学推理](/posts/2025/11/28/deepseek-math-v2-self-verifiable-math-reasoning/)
- 日期: 2025-11-28T04:33:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于DeepSeek-V3.2-Exp-Base的多模型MoE架构，工程化verifier-generator闭环与meta-verification，提升IMO金牌级定理证明，提供落地参数与监控要点。

### [API驱动的AI电话机器人：外呼与呼入集成实现](/posts/2025/11/28/api-driven-phone-bot-call-center-ai/)
- 日期: 2025-11-28T04:07:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过API触发AI代理外呼或处理呼入电话，提供电话机器人工程化参数与部署清单。

### [Memori：AI代理的分层记忆引擎](/posts/2025/11/28/memori-hierarchical-memory-engine-for-ai-agents/)
- 日期: 2025-11-28T03:48:21+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Memori通过SQL-native分层记忆架构，为LLM/AI代理提供短/长期记忆层，支持embedding-like检索、多代理共享及高效更新查询操作。

### [TPU 自定义互连与生态锁定 vs GPU 扩展瓶颈：Google 长期 AI 集群策略关键参数](/posts/2025/11/28/tpu-custom-interconnect-ecosystem-lockin-vs-gpu-scaling-bottlenecks/)
- 日期: 2025-11-28T03:33:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 工程剖析 TPU ICI/OCS 3D torus 高效 scaling 与 GPU NVLink/InfiniBand 瓶颈，揭示生态锁定下 Google 集群 TCO 优化与长期 AI 竞赛定位参数。

### [TrendRadar：基于MCP的多平台热点AI分析工具](/posts/2025/11/28/trendradar-mcp-ai-analysis/)
- 日期: 2025-11-28T00:34:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: TrendRadar聚合35平台热点，利用MCP协议集成13种AI分析工具，实现趋势追踪、情感分析与相似检索，支持Docker部署与多渠道推送。

### [Milvus 云原生亿级向量 ANN 搜索：HNSW/IVF-PQ 分片索引与查询分布工程参数](/posts/2025/11/28/milvus-cloud-native-billion-scale-ann-search-hnsw-ivf-pq-sharding/)
- 日期: 2025-11-28T00:07:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对亿级向量低延迟 ANN 检索，Milvus 云原生架构通过 HNSW/IVF-PQ 索引结合分片与查询分布，提供可扩展参数配置与监控清单。

### [Runprompt：CLI 执行可复用 LLM Prompt 模板文件](/posts/2025/11/28/runprompt-cli-for-dotprompt-files/)
- 日期: 2025-11-28T00:03:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Runprompt CLI 工具详解：通过 .prompt 文件实现 LLM 提示模板的变量替换、模型路由、结构化输出与链式调用，支持工程化 prompt 管理。

### [TPU脉动阵列对比GPU张量核：HBM效率与Google长期AI训练路径](/posts/2025/11/27/tpu-systolic-vs-gpu-tensor-hbm-efficiency-google-scaling/)
- 日期: 2025-11-27T23:33:16+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 对比TPU systolic array与GPU tensor cores在HBM带宽与功率效率的优势，剖析Google长期AI训练的工程参数与扩展策略。

### [TPU 脉动阵列与 HBM 带宽对比 GPU 张量核：稠密矩阵乘法与动态负载下的能效扩展](/posts/2025/11/27/tpu-systolic-arrays-vs-gpu-tensor-cores-hbm-power-scaling-ai-training/)
- 日期: 2025-11-27T23:18:15+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 TPU 脉动阵列在稠密矩阵乘法中的 HBM 带宽利用与能效优势，对比 GPU 张量核在动态负载下的灵活性与长期训练热功耗挑战，提供集群参数与监控清单。

### [ADK-Go 零依赖运行时：无 Shim 工具调用与并发 Context 缓存](/posts/2025/11/27/zero-dep-adk-go-runtime-tool-calling/)
- 日期: 2025-11-27T22:34:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Go 代码优先的零依赖 AI 代理运行时，实现 shimless 工具调用与并发 context 缓存，支持多代理低延迟协调的参数配置。

### [通过 n8n 节点图编排容错代理式 AI 流水线：LLM 链式、条件分支、重试逻辑与凭证隔离](/posts/2025/11/27/orchestrate-fault-tolerant-agentic-ai-pipelines-via-n8n-node-graphs/)
- 日期: 2025-11-27T22:19:54+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 n8n 可视化节点图构建生产级代理式 AI 流水线，详解 LLM 链式调用、API 编排、条件分支、重试机制及凭证隔离的最佳参数与监控要点。

### [LM辅助编码：本质与事故复杂性的工程平衡](/posts/2025/11/27/lm-assisted-coding-essence-accident-balance/)
- 日期: 2025-11-27T22:08:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 工程化LM辅助编码实践：平衡本质复杂性（形式正确性验证）与事故复杂性（实用迭代部署、错误容忍），提供工具链集成、参数配置与监控框架。

### [LightRAG 双图实体关系索引与查询融合：简易低资源 RAG 实现](/posts/2025/11/27/lightrag-dual-graph-entity-relation-indexing-query-fusion-distillation/)
- 日期: 2025-11-27T22:05:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双图索引、查询融合与 chunk 参数优化，实现低资源高效 RAG，结合蒸馏技术超越稠密检索基线。

### [训练时令牌注入实现 GPL 许可元数据嵌入 AI 模型权重：蒸馏传播检查与合规审计](/posts/2025/11/27/training-token-injection-for-gpl-metadata-in-ai-model-weights-distillation-propagation-checks/)
- 日期: 2025-11-27T21:33:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 GPL copyleft 在 AI 模型训练中的传播不确定性，提出通过训练时特殊令牌注入嵌入可验证许可元数据的技术方案，实现蒸馏传播检查与合规审计机制。

### [攻克 AI 代理工程陷阱：稳健规划循环、可靠工具调用与持久状态管理](/posts/2025/11/27/overcoming-ai-agent-engineering-pitfalls-planning-tools-state/)
- 日期: 2025-11-27T21:04:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 AI 代理设计核心痛点，提供规划循环、工具调用及状态管理的工程参数、阈值与监控清单，实现生产级可靠性。

### [通过 Azure /call API 工程化 AI Agent 主动拨打电话](/posts/2025/11/27/ai-agent-outbound-telephony-via-azure-call-api/)
- 日期: 2025-11-27T20:08:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Microsoft Call Center AI 的 /call API 派遣 AI agent 主动拨出电话，支持 GPT-4o-mini 流式语音、RAG 检索、中断感知工具调用，实现呼叫中心 outbound 自动化。

### [Fara-7B LoRA 高效微调：屏幕解析到动作执行的低延迟代理管道](/posts/2025/11/27/fara-7b-lora-screen-parsing-action-execution/)
- 日期: 2025-11-27T19:48:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于Fara-7B的LoRA微调方案，实现屏幕截图解析、动作预测与执行的工程化优化，提供参数配置、训练清单与低延迟推理要点。

### [VERL中多GPU数据并行KL正则化PPO：可扩展离线RLHF偏好排名蒸馏实现](/posts/2025/11/27/multi-gpu-data-parallel-kl-regularized-ppo-in-verl-for-scalable-offline-rlhf-preference-distillation/)
- 日期: 2025-11-27T19:18:21+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: VERL框架下，利用FSDP实现多GPU数据并行KL-PPO，支持离线RLHF偏好排名蒸馏。详解配置参数、3D-HybridEngine优化与监控要点，确保高效训练大模型对齐。

### [LightRAG 双图查询融合：低资源环境下的快速检索](/posts/2025/11/27/lightrag-dual-graph-query-fusion-low-resource/)
- 日期: 2025-11-27T18:48:15+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过实体-关系双图与 hybrid 查询融合，实现低资源 RAG 的 chunk 阈值优化、边提炼与快速检索参数。

### [Memori：工程化多代理分层记忆系统——嵌入层次与 episodic recall 实现长期会话持久化](/posts/2025/11/27/memori-hierarchical-agent-memory-multi-agent/)
- 日期: 2025-11-27T17:48:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Memori 的分层记忆机制，支持 multi-agent 长期会话的 episodic recall 与高效 SQL 检索，提供工程化配置参数与用户隔离策略。

### [Fara-7B 代理模型训练：屏幕解析、动作标记化与 LoRA 多 GPU 适配](/posts/2025/11/27/fara-7b-agentic-training-screen-parsing-lora/)
- 日期: 2025-11-27T17:03:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 详解微软 Fara-7B 7B 代理模型高效训练路径：合成数据管道、屏幕视觉解析与动作令牌化设计，以及 LoRA 在多 GPU 上的参数配置、监控要点与回滚策略。

### [使用 ERA microVM 实现本地 AI 代理沙箱隔离与资源控制](/posts/2025/11/27/era-local-ai-agent-sandbox/)
- 日期: 2025-11-27T14:32:36+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 ERA CLI 在本地部署微型虚拟机沙箱，支持进程隔离、CPU/内存配额、输出捕获和安全工具执行，防止主机逃逸。

### [用 ADK-Go 构建多代理评估流水线：基准测试与协作控制](/posts/2025/11/27/adk-go-multi-agent-eval-pipelines/)
- 日期: 2025-11-27T13:32:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于零依赖 Go 运行时，详解多代理协作基准测试的关键参数、监控要点与落地部署策略。

### [Fara-7B：高效代理式屏幕解析与动作执行的工程实践](/posts/2025/11/27/fara-7b-efficient-agentic-screen-parsing-and-action-execution/)
- 日期: 2025-11-27T12:33:09+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 聚焦微软Fara-7B 7B模型在视觉屏幕解析、坐标预测动作执行与本地低延迟代理工作流的工程参数、阈值与部署清单。

### [使用 ADK-Go 实现代码优先的多代理运行时](/posts/2025/11/27/code-first-multi-agent-runtime-with-adk-go/)
- 日期: 2025-11-27T10:32:47+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: ADK-Go 提供零依赖 Go 运行时，支持复杂多代理 AI 系统的灵活构建、评估与部署，聚焦代码优先的编排机制与工程参数。

### [Fara-7B Screen Parsing and Action Execution Engineering](/posts/2025/11/27/fara-7b-screen-parsing-action-execution/)
- 日期: 2025-11-27T10:17:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Fara-7B实时屏幕解析与动作执行管道的工程实践，低延迟容错机制与阈值调优参数指南。

### [Sutskever 与 LeCun 预言 GPU 规模时代终结：推理时工程化实践指南](/posts/2025/11/27/sutskever-lecun-end-gpu-scaling-inference-engineering/)
- 日期: 2025-11-27T10:03:19+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Sutskever 和 LeCun 指出 GPU 规模化已达极限，转向推理时工程：MoE 动态路由、测试时适应、蒸馏与代理计算优化管道的参数配置与监控要点。

### [后参数Scaling：推理时扩展、MoE路由与RAG工程绕LLM极限](/posts/2025/11/27/post-parameter-scaling-inference-time-compute-moe-routing-rag-engineering-for-llms/)
- 日期: 2025-11-27T09:33:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Sutskever与LeCun辩论scaling极限，工程实践聚焦推理时计算、MoE路由、RAG，提供阈值参数与部署清单。

### [VERL 中 KL 正则化 PPO 的离线 RLHF：多 GPU 数据高效对齐](/posts/2025/11/27/kl-regularized-ppo-offline-rlhf-in-verl/)
- 日期: 2025-11-27T08:07:51+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: VERL 框架下 KL 正则 PPO 离线 RLHF 配置、多 GPU 分片与稳定性调参要点，实现数据高效 LLM 对齐。

### [Yolodex 实时客户数据丰富 API：多源聚合与低延迟工程实践](/posts/2025/11/27/yolodex-real-time-customer-enrichment-api/)
- 日期: 2025-11-27T07:32:42+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 Yolodex API 的多源聚合、语义匹配、低延迟缓存与隐私沙箱工程，提供可落地参数、阈值与监控要点，实现实时客户洞察驱动增长。

### [Fara-7B SLM 与屏幕解析、动作预测及键鼠仿真的 agentic 计算机使用集成](/posts/2025/11/27/integrating-fara-7b-for-agentic-computer-use-screen-parsing-and-action-execution/)
- 日期: 2025-11-27T07:17:43+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向自主计算机任务执行，给出 Fara-7B 与屏幕解析、动作预测、Playwright 键鼠仿真的工程化集成参数与监控要点。

### [Gemini CLI 实现 Agentic Coding：工具调用链、多轮对话与文件 I/O 重试机制](/posts/2025/11/27/gemini-cli-for-agentic-coding-tool-calling-multi-turn-file-io-and-retry/)
- 日期: 2025-11-27T06:02:25+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Gemini CLI 通过 ReAct 循环驱动的工具调用链，支持多轮对话状态管理、文件 I/O 集成与重试机制，实现复杂任务自动化。提供工程参数、落地清单与监控要点。

### [LightRAG 双图检索中的动态 Chunk 阈值与 Query 融合优化](/posts/2025/11/27/lightrag-dual-graph-query-fusion-chunk-thresholds/)
- 日期: 2025-11-27T04:18:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双层图检索实现 query 融合与动态 chunk 阈值选择，支持低资源高效 RAG，提供参数调优清单与监控要点。

### [构建动态API路由器：实时比较OpenAI/Anthropic/Gemini token价格与延迟](/posts/2025/11/27/building-dynamic-api-router-real-time-openai-anthropic-gemini-cost-optimization/)
- 日期: 2025-11-27T03:47:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 自建动态路由器实现LLM调用最低成本优化，覆盖OpenAI/Anthropic/Gemini价格监控、延迟阈值与回退策略，提供完整工程参数与落地清单。

### [客户端 Slop 侦探：词汇启发式与突发性指标过滤无水印 LLM 垃圾内容](/posts/2025/11/27/client-side-slop-detective-lexical-heuristics-and-burstiness-metrics-for-filtering-watermark-free-llm-slop/)
- 日期: 2025-11-27T03:18:30+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 纯前端 JS 实现 AI slop 过滤：词汇重复率、突发性分数计算公式、工程阈值与落地清单，无需服务器或水印。

### [Gemini CLI：通过多轮提示与工具集成实现 Agentic Coding 的迭代精炼](/posts/2025/11/27/gemini-cli-agentic-coding/)
- 日期: 2025-11-27T03:02:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Gemini CLI 支持状态会话、多工具调用与 ReAct 循环，助力代码迭代精炼与调试管道工程化。

### [基于代码优先的 Go 多代理 AI 系统运行时：零依赖构建、评估与部署](/posts/2025/11/27/code-first-go-runtime-for-multi-agent-ai-systems/)
- 日期: 2025-11-27T02:34:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 工程化代码优先的 Go ADK 运行时，用于多代理 AI 系统的构建、基准评估与灵活部署管道，提供零依赖运行、性能基准与控制参数。

### [构建TrendRadar：多平台热点聚合与AI智能推送管道](/posts/2025/11/27/building-trendradar-multi-platform-hotspot-aggregation/)
- 日期: 2025-11-27T01:32:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于开源TrendRadar，聚合35+平台热点，实现关键词智能筛选、趋势追踪与多渠道推送，支持Docker零编程部署的关键参数与工程实践。

### [Docker 容器化 Llama3 完全离线 RAG 管道：本地嵌入、检索与推理全栈部署](/posts/2025/11/27/docker-llama3-offline-rag-pipeline/)
- 日期: 2025-11-27T00:48:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 使用 Docker Compose 部署 Ollama Llama3、ChromaDB 和 Streamlit 的离线 RAG 系统，给出硬件要求、部署参数与性能优化清单。