# 分类：ai-systems

> 该分类下的文章按时间倒序排列，便于按主题继续深挖。

## 页面摘要
- 路径: /categories/ai-systems/page/42/
- 当前页: 42 / 75
- 文章总数: 5960
- 当前页文章数: 80

## 快速导航
- [首页](/)
- [分类索引](/categories/)
- [归档索引](/archive/)

## 本页文章
### [TrendRadar Docker 多渠道推送集成：企业微信/飞书/ntfy 等零编程部署](/posts/2025/11/26/docker-multi-channel-push-integration-for-trendradar/)
- 日期: 2025-11-26T20:07:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: TrendRadar Docker 30s部署多平台热点聚合，支持企业微信/飞书/Telegram/ntfy多端推送集成，MCP AI工具参数配置与监控要点。

### [LightRAG简单快速RAG：双图边蒸馏与chunk粒度阈值查询融合](/posts/2025/11/26/lightrag-simple-fast-rag-distillation/)
- 日期: 2025-11-26T20:05:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG通过双图边蒸馏实现简单快速RAG，结合chunk粒度阈值和查询融合，支持低资源高效检索与调优。

### [ADK-Go 零依赖代理运行时：评估基准与部署参数工程化](/posts/2025/11/26/zero-dep-adk-go-agent-runtime-eval-benchmarks/)
- 日期: 2025-11-26T19:48:06+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 ADK-Go 零依赖运行时，剖析 Agent 评估基准设计、部署参数调优与监控阈值，实现高效构建与生产级部署。

### [ADK-Go 零依赖运行时：多代理评估基准与部署实践](/posts/2025/11/26/zero-dependency-runtime-in-adk-go-multi-agent-eval/)
- 日期: 2025-11-26T19:17:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 ADK-Go 实现零外部依赖的 AI 多代理运行时，支持基准评估与灵活部署，提供配置参数、监控阈值与回滚清单。

### [LightRAG 双图 RAG 实现：边提炼、分块阈值与查询融合工程参数](/posts/2025/11/26/lightrag-dual-graph-query-fusion/)
- 日期: 2025-11-26T18:18:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双层图检索（实体+关系）实现低资源高效 RAG，详解边提炼参数、分块阈值设置与 hybrid 查询融合策略，优于稠密基线。

### [用 Microsoft Call Center AI 实现电话 API 调度：AI 代理主动拨打](/posts/2025/11/26/microsoft-call-center-ai-telephony-api-dispatch/)
- 日期: 2025-11-26T18:08:51+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 详解 Call Center AI 的 /call API，用于 AI 代理或配置号码直接发起 bot 通话，实现实时 telephony tool-calling 的工程参数与落地清单。

### [图像扩散模型涌现时序传播：零样本视频生成工程管道](/posts/2025/11/26/zero-shot-video-gen-using-emergent-temporal-propagation-in-diffusion-models/)
- 日期: 2025-11-26T18:03:54+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用图像扩散模型的涌现时序传播特性，零样本构建视频生成管道，实现帧间一致序列，无需视频训练数据，提供工程参数与监控清单。

### [使用 ADK-Go 构建 Code-First 多代理运行时：零依赖 Go 部署与编排实践](/posts/2025/11/26/code-first-multi-agent-runtime-with-adk-go/)
- 日期: 2025-11-26T17:03:03+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 ADK-Go 实现 code-first AI 代理工具包，提供零依赖 Go 运行时、多代理编排、评估基准及灵活部署管道的参数配置与监控要点。

### [LightRAG 双图边蒸馏工程实践：低资源 RAG 的 chunk 阈值、查询融合与检索调优](/posts/2025/11/26/lightrag-dual-graph-edge-distillation-chunk-thresholds-query-fusion/)
- 日期: 2025-11-26T16:48:05+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对低资源 RAG 场景，详解 LightRAG 双图边知识蒸馏的 chunk 粒度阈值优化、查询多级融合机制及无重训检索参数调优，提供可落地参数清单与监控要点。

### [构建Milvus亿级向量ANN搜索系统：分布式分片、HNSW-IVF混合索引构建与故障容忍查询规划管道](/posts/2025/11/26/building-milvus-billion-scale-vector-ann-search-distributed-sharding-hnsw-ivf-hybrid-index-build-fault-tolerant-query-planning-pipelines/)
- 日期: 2025-11-26T16:08:54+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Milvus亿级向量搜索系统工程实践：分片策略、混合索引构建参数、查询规划与容错机制，确保高可用低延迟。

### [构建Milvus亿级向量ANN搜索系统：分布式分片、HNSW-IVF混合索引与故障容忍查询管道](/posts/2025/11/26/building-milvus-billion-scale-vector-ann-search-distributed-sharding-hnsw-ivf-hybrid-indexing-fault-tolerant-query-pipelines/)
- 日期: 2025-11-26T16:08:08+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Milvus亿级向量搜索系统工程实践：分片策略、混合索引构建参数、查询规划与容错机制。

### [代码优先的 Go AI Agent 工具包：评估流水线与部署控制](/posts/2025/11/26/code-first-go-ai-agent-toolkit-eval-deploy/)
- 日期: 2025-11-26T16:03:14+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: adk-go 提供 code-first Go SDK，聚焦工具编排、多代理评估流水线、零依赖运行时与灵活部署控制的工程参数与监控要点。

### [LightRAG 双图 RAG 的边蒸馏：边缘部署下的低资源块粒度阈值、查询融合与检索指标调优](/posts/2025/11/26/lightrag-dual-graph-edge-distillation-low-resource-tuning/)
- 日期: 2025-11-26T15:33:10+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过边蒸馏构建双图结构，实现低资源 RAG 高效检索。详解块粒度阈值调优、查询融合及边缘部署指标，提供参数清单与监控要点。

### [TrendRadar MCP AI 分析工具链：13种舆情深度挖掘工具工程实践](/posts/2025/11/26/trendradar-mcp-ai-analysis-toolkit/)
- 日期: 2025-11-26T14:08:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 MCP 协议的 13 种 AI 工具，支持自然语言舆情分析：趋势追踪、情感分析、相似检索等。Docker 部署参数与 Claude/Cursor 集成要点。

### [工程化斯坦福CS234强化学习基线：PPO/A2C分布式训练实践](/posts/2025/11/26/engineering-cs234-rl-baselines-for-distributed-training/)
- 日期: 2025-11-26T11:19:00+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于Stanford CS234课程，详解PPO/A2C基线分布式工程：多环境rollouts、actor-critic同步、GPU价值网络加速及off-policy修正参数。

### [工程化 Burrito 测试管道：扩散模型多帧一致性度量与阈值](/posts/2025/11/26/engineer-burrito-test-pipeline-diffusion-temporal-consistency/)
- 日期: 2025-11-26T09:05:13+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对扩散模型视频生成，实现 Burrito 测试管道，定义多帧一致性指标、退化阈值及提示稳定性基准，提供工程化参数与监控清单。

### [用 Ironwood TPU 部署低延迟 AI 推理：3nm 工艺、192GB HBM3E 与优化软件栈的高吞吐实践](/posts/2025/11/26/deploy-low-latency-ai-inference-ironwood-tpu/)
- 日期: 2025-11-26T08:33:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Ironwood TPU 凭借 3nm 工艺、192GB HBM3E 内存与 vLLM/GKE 软件栈，实现低延迟高吞吐 AI 推理服务，提供部署参数、阈值与监控清单。

### [扩散模型 Burrito 时间退化剖析：Prompt 鲁棒性衰减检测与 Fine-tune 漂移缓解工程实践](/posts/2025/11/26/diffusion-models-burrito-temporal-degradation/)
- 日期: 2025-11-26T08:05:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 扩散模型随迭代生成半吃 burrito 退化现象，剖析 prompt 鲁棒性衰减与 data contamination，提供检测阈值与 fine-tune 参数清单，实现工程稳定。

### [实时MoE专家负载均衡的线性规划求解器集成：HiGHS vs Gurobi 与低延迟优化](/posts/2025/11/26/integrate-lp-solvers-realtime-moe-load-balancing-highs-vs-gurobi/)
- 日期: 2025-11-26T07:18:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对LPLB的动态令牌分配，比较HiGHS开源高效与Gurobi商用顶级LP求解器，给出约束公式、多GPU分片参数及运行时监控策略。

### [苏茨克维尔后Scaling时代AI研究加速：假设生成代理与自动化实验闭环](/posts/2025/11/26/sutskever-age-of-research/)
- 日期: 2025-11-26T06:50:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 后scaling时代，基于假设生成代理、自动化实验循环、元学习自我改进及低数据训练，实现AI研究加速的工程参数与监控要点。

### [火山引擎 verl：支持 PPO Actor-Critic 和 KL 正则化的离线 RLHF 工具包](/posts/2025/11/26/volcano-engine-verl-offline-rlhf-toolkit-ppo-kl-multi-gpu/)
- 日期: 2025-11-26T06:08:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 火山引擎 verl 开源 RLHF 工具包，提供 PPO actor-critic 架构、KL 正则化、梯度裁剪及多 GPU 分布式训练的关键参数与工程实践。

### [LPLB 中基于 LP 的动态专家分片与路由：容量约束与实时重平衡](/posts/2025/11/26/lp-based-dynamic-expert-sharding-and-routing-in-lplb/)
- 日期: 2025-11-26T04:38:43+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 详解 LPLB 的线性规划动态专家分片机制，包括边容量约束、IPM 求解松弛与异构延迟下的实时重平衡参数。

### [AI 代理的 API 电话调度：PSTN 通话分发与号码绑定](/posts/2025/11/26/api-phone-dispatching-for-ai-agents/)
- 日期: 2025-11-26T04:11:15+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: code-first API 让 AI 代理调度 PSTN 通话、绑定号码实现 bot 直连，集成 Twilio 绕过外部服务商，给出参数配置与监控要点。

### [Go 语言下代码优先构建、评估与部署 AI 代理：零依赖工具包与延迟准确性基准](/posts/2025/11/26/build-eval-deploy-ai-agents-in-go-zero-dep-runtime-benchmarks/)
- 日期: 2025-11-26T03:49:25+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 ADK-Go 零依赖工具包，代码优先方式构建 AI 代理，提供评估延迟/准确性权衡基准框架，以及 Cloud Run 部署参数与监控要点。

### [LightRAG 双图边蒸馏融合：块粒度阈值调优与查询管道实现低资源RAG](/posts/2025/11/26/lightrag-dual-graph-edge-distillation-tuning/)
- 日期: 2025-11-26T03:04:48+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG双层图检索经边关系蒸馏融合，调优chunk_token_size(800-1400)、cosine_threshold(0.15-0.25)，hybrid查询模式下低资源RAG效率提升，提供参数清单与监控要点。

### [精选 4300+ n8n JSON 工作流：无代码构建 Agentic AI 自动化](/posts/2025/11/26/curated-n8n-workflows-for-agentic-ai-automation/)
- 日期: 2025-11-26T02:09:13+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Zie619 仓库的 n8n 工作流合集，提供 LLM 链式调用、RAG 管道、API 触发器与错误重试循环的即插即用模板，实现多步 Agent 快速部署参数与监控要点。

### [LPLB：基于线性规划的MoE负载均衡器](/posts/2025/11/26/lplb-moe-load-balancer-linear-programming/)
- 日期: 2025-11-26T02:03:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 将MoE token到专家路由建模为线性规划，利用单SM IPM求解器实现动态负载均衡、最小化GPU间排队延迟和高吞吐分布式推理。

### [Memori 多代理记忆持久化：开源引擎构建与同步策略](/posts/2025/11/26/multi-agent-memory-persistence-with-memori/)
- 日期: 2025-11-26T01:38:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 LLM 多代理系统，给出 Memori 记忆引擎的持久化存储、语义检索与跨会话同步的工程化参数与实现要点。

### [FLUX.2 管道：训练前沿规模扩散模型以提升提示遵循、多样性和人类偏好对齐](/posts/2025/11/26/flux-2-frontier-visual-intelligence-pipelines/)
- 日期: 2025-11-26T00:34:40+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析FLUX.2的训练管道，给出大规模扩散模型蒸馏与微调的工程参数、阈值与落地清单。

### [LightRAG：简单快速RAG实现：图蒸馏融合检索与低资源管道](/posts/2025/11/26/lightrag-simple-fast-rag/)
- 日期: 2025-11-26T00:19:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG通过图索引与双层检索机制，实现低资源高效RAG管道，支持Ollama本地部署与hybrid查询模式优化。

### [Memori：LLM 代理记忆引擎构建指南](/posts/2025/11/26/memori-llm-agent-memory-engine/)
- 日期: 2025-11-26T00:03:30+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 一行代码集成 Memori，为 LLM 和代理构建 SQL 原生持久记忆，支持语义检索、多代理共享及长程上下文管理，提供工程化参数与落地清单。

### [Onyx 聊天 UI 实时 WebSocket/SSE 多模型流式与会话持久化](/posts/2025/11/25/onyx-chat-ui-realtime-websocket-sse/)
- 日期: 2025-11-25T23:49:00+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 开源 Onyx Chat UI 通过 WebSocket/SSE 实现多模型实时流式输出、多会话持久化和低延迟处理，提供工程参数配置与监控要点。

### [用 Verl 实现分布式 RLHF 多 GPU PPO 训练：Preference 数据分片与 KL 正则同步](/posts/2025/11/25/distributed-rlhf-multi-gpu-with-verl/)
- 日期: 2025-11-25T22:35:29+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Verl 框架详解分布式 RLHF，支持多 GPU PPO 训练，通过 FSDP 数据并行、preference 数据集分片与 KL 正则化同步，实现高效 LLM 对齐工程。

### [ADK-Go 部署流水线：灵活编排与云原生部署实践](/posts/2025/11/25/adk-go-deployment-pipelines/)
- 日期: 2025-11-25T21:04:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于代码优先的 ADK-Go SDK，剖析 AI agent 部署流水线的构建方式、Cloud Run 参数配置与监控清单，实现高效、无外部依赖的云原生部署。

### [SAM3 提示驱动实例分割管道：实时 mask 生成、视频跟踪与边缘优化](/posts/2025/11/25/sam3-prompt-driven-instance-segmentation-pipeline/)
- 日期: 2025-11-25T20:49:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 SAM3 提示式图像/视频实例分割管道，详解文本/点/框输入到 mask 生成、跟踪机制，以及边缘部署的优化参数与清单。

### [LightRAG 低资源边缘双图蒸馏融合超参数优化](/posts/2025/11/25/lightrag-low-resource-edge-distillation-fusion-hyperparams/)
- 日期: 2025-11-25T20:11:24+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对低资源边缘/移动部署的 LightRAG 双图 RAG，给出 chunk 粒度阈值、查询融合权重等工程参数与监控要点。

### [LightRAG 双图边缘蒸馏融合：低资源边缘 RAG 的块粒度、蒸馏阈值与查询融合工程](/posts/2025/11/25/lightrag-dual-graph-edge-distillation-fusion-low-resource-rag-chunk-granularity-thresholds-query-fusion-engineering/)
- 日期: 2025-11-25T18:56:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 在边缘设备上实现高效 RAG，给出 chunk 分块参数、蒸馏阈值选择与 hybrid 查询融合的工程化实践。

### [30秒Docker部署TrendRadar：多平台热点监控+MCP-AI情感/相似分析+企业微信/Telegram/ntfy推送](/posts/2025/11/25/trendradar-docker-multi-push-notifications/)
- 日期: 2025-11-25T18:11:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: TrendRadar Docker一键部署多平台热点+MCP-AI分析，企业微信/Telegram/ntfy推送工程参数与监控要点。

### [代码优先的 Go SDK：用 ADK 构建、评估与部署 AI 代理](/posts/2025/11/25/code-first-go-sdk-adk-for-ai-agent-building-eval-deploy/)
- 日期: 2025-11-25T17:10:11+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Google ADK-Go 的代码优先范式，聚焦多代理编排、工具调用、并发管道与高吞吐部署的工程参数与基准。

### [LightRAG 双图边蒸馏融合低资源边缘调优：量化剪枝阈值实现亚秒检索](/posts/2025/11/25/lightrag-dual-graph-edge-distillation-fusion-for-low-resource-edge/)
- 日期: 2025-11-25T16:49:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG双图结构低资源边缘部署调优：量化小LLM、图剪枝融合阈值、参数清单确保Jetson亚秒检索延迟。

### [使用 verl 构建离线 RLHF 工具包：PPO Actor-Critic 中的 KL 正则化与梯度裁剪](/posts/2025/11/25/build-verl-offline-rlhf-toolkit-ppo-actor-critic-kl-regularization-gradient-clipping/)
- 日期: 2025-11-25T15:04:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 LLM 对齐部署，详解 volcengine/verl 中 PPO actor-critic 的离线 RLHF 实现，包括 KL 正则化、梯度裁剪参数与可扩展数据处理要点。

### [LightRAG：简单快速检索图蒸馏，低资源 RAG 部署调优](/posts/2025/11/25/lightrag-simple-fast-retrieval-graph-distillation/)
- 日期: 2025-11-25T14:37:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双图边蒸馏融合向量与图检索，实现 EMNLP 基准的高效低资源 RAG 管道，提供部署参数与监控要点。

### [用API触发AI代理拨打电话与直接bot接入：呼叫中心自动化集成](/posts/2025/11/25/api-phone-dispatching-for-direct-bot-calling/)
- 日期: 2025-11-25T12:33:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于Microsoft Call-Center-AI，详解API驱动外呼与直接bot内呼的工程参数、阈值配置及工具调用集成，实现实时呼叫中心自动化。

### [LightRAG 双图边蒸馏融合：低资源快速 RAG 检索工程化](/posts/2025/11/25/lightrag-dual-graph-edge-distillation-fusion/)
- 日期: 2025-11-25T12:19:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双层图检索、边蒸馏与融合策略，实现低资源环境下的简单高效 RAG，详述部署参数、阈值调优与监控清单。

### [从 GPT-3 到 Gemini 3：3 年 LLM 规模化工程里程碑——计算数据效率、MoE 路由与上下文扩展](/posts/2025/11/25/from-gpt-3-to-gemini-3-3-year-llm-scaling-milestones-compute-data-efficiency-moe-routing-context-scaling/)
- 日期: 2025-11-25T10:35:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从 GPT-3 到 Gemini 3 的工程演进，聚焦计算数据效率、MoE 路由优化、上下文从 2K 到 100 万 token 扩展，以及多模态代理落地参数与监控要点。

### [adk-go 多代理编排运行时：工具调用与状态协调工程实践](/posts/2025/11/25/adk-go-multi-agent-orchestration-runtime/)
- 日期: 2025-11-25T09:49:52+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: adk-go 代码优先 Go AI 代理工具包的多代理运行时设计：集成工具调用、状态持久化、并行协调参数与生产部署要点。

### [构建 OCR Arena 互动评测游乐场：实时多模型 OCR 对比与 ELO 排名](/posts/2025/11/25/building-ocr-arena-playground/)
- 日期: 2025-11-25T07:34:42+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 手把手构建类似 OCR Arena 的实时互动平台，支持图像/PDF 上传、匿名模型盲测、用户投票生成 ELO 排行，以及 CER/WER 等自动化评估管道。

### [ChatGPT 工程实时幻觉检测管道：监控脱离现实迹象与生产干预](/posts/2025/11/25/chatgpt-engineering-realtime-hallucination-detection-pipeline-reality-guardrails/)
- 日期: 2025-11-25T06:50:09+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向ChatGPT生产环境，给出实时幻觉检测管道、用户脱离现实监控与干预策略的工程参数。

### [轻量 Docker 部署 TrendRadar：MCP AI 多平台热点聚合与 13 种分析工具](/posts/2025/11/25/trendradar-mcp-multi-platform-news-aggregation/)
- 日期: 2025-11-25T05:36:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 用 Docker 快速部署 TrendRadar，轻量 MCP AI 聚合抖音/B站/知乎等 35 平台热点，支持 13 种分析工具（趋势/情感/检索）和多渠道通知。

### [StreetView 全景文本搜索：CLIP 视觉嵌入 + FAISS 索引 + 地理过滤工程实践](/posts/2025/11/25/streetview-text-search-vision-embedding-geo-retrieval/)
- 日期: 2025-11-25T05:23:29+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 CLIP 视觉嵌入、FAISS 向量索引与地理空间过滤，构建高效 StreetView 全景语义检索系统，给出模型参数、索引配置、查询阈值与监控要点。

### [用 fMRI/EEG 和 Transformer 构建预测前意识思想的神经解码器](/posts/2025/11/25/build-neural-decoders-with-fmri-eeg-transformers-for-preconscious-thought-prediction/)
- 日期: 2025-11-25T04:34:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于脑活动序列模式，使用 Transformer 模型从 fMRI/EEG 数据构建神经解码器，实现前意识思想预测的工程参数、架构设计与落地监控要点。

### [苦涩教训下评估LLM扩展架构：RAG与工具的混合优化](/posts/2025/11/25/evaluating-llm-extensions-against-bitter-lesson/)
- 日期: 2025-11-25T04:22:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于苦涩教训审视RAG和工具等LLM扩展架构，优化计算绑定推理的混合系统，避免模块瓶颈，提供工程参数与落地清单。

### [Claude 高级工具调用：多工具并行、状态持久化与错误重试工程实践](/posts/2025/11/25/claude-advanced-tool-use-parallel-stateful-retry/)
- 日期: 2025-11-25T04:04:57+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于Claude API的高级工具集成方案，实现多工具并行执行、会话状态持久与智能重试，支持复杂代理工作流，提供落地参数与监控要点。

### [工程化 Claude Opus 4.5 推理缩放：长上下文优化、MoE 路由与工具调用集成](/posts/2025/11/25/claude-opus-4-5-inference-scaling-optimization-moe-routing-tool-integration-multimodal-deployment/)
- 日期: 2025-11-25T03:20:14+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 Claude Opus 4.5 的长上下文推理，提供 KV 缓存优化、MoE 路由阈值与工具调用参数，实现多模态高效部署。

### [工程化 Agentic LLM 用于个性化产品演示：实时交互与多步推理链](/posts/2025/11/25/engineering-agentic-llms-for-personalized-product-demos/)
- 日期: 2025-11-25T02:49:24+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Karumi 实践，给出构建 agentic LLM 产品演示系统的工程参数、工具链与监控策略。

### [工程化云原生 Milvus：亿级 ANN 搜索的分布式分片、混合 HNSW/IVF 索引与容错查询规划](/posts/2025/11/25/engineer-cloud-native-milvus-billion-scale-ann-distributed-sharding-hybrid-hnsw-ivf-indexes-fault-tolerant-query-planning/)
- 日期: 2025-11-25T00:34:40+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向亿级向量ANN搜索，给出Milvus云原生架构、分片策略、混合HNSW/IVF索引配置与容错查询规划的工程参数、部署清单与监控要点。

### [Call Center AI 实时电话工具调用：Azure API 集成与低延迟参数](/posts/2025/11/25/call-center-ai-real-time-telephony-tool-calling/)
- 日期: 2025-11-25T00:09:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于微软开源 Call Center AI，详解实时工具调用与 Azure Speech 集成的工程参数，实现低延迟电话机器人。

### [用 ADK-Go 实现 Code-First AI Agent 开发：多代理编排与部署参数](/posts/2025/11/24/code-first-ai-agent-development-with-adk-go-multi-agent-orchestration/)
- 日期: 2025-11-24T21:06:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Google ADK-Go 的 code-first Go SDK，详解构建复杂 AI agents 的工具集成、多代理控制与生产部署配置。

### [CERN AI 原则下 LHC 数据管道的可审计工程实践：重现性检查、偏差控制与来源日志](/posts/2025/11/24/engineering-auditable-ai-pipelines-for-lhc-data-under-cern-ai-principles-reproducibility-bias-control-provenance/)
- 日期: 2025-11-24T19:50:19+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 CERN 高能物理 FAIR AI 原则，构建 LHC 高吞吐管道，包括重现容器化、偏差审计、来源追踪参数与监控清单。

### [Memori 多代理分层记忆同步协议：向量检索与实时协调工程实践](/posts/2025/11/24/memori-multi-agent-hierarchical-memory-sync-protocol/)
- 日期: 2025-11-24T18:49:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 Memori 在多代理协作中的分层记忆引擎，详解实时同步协议、向量检索集成及工程化参数配置，实现 LLM 代理间高效记忆共享。

### [Azure 电话呼叫中心 AI 的实时工具调用：动态 STT/LLM/TTS 循环与错误恢复](/posts/2025/11/24/real-time-tool-calling-azure-call-center-ai-telephony/)
- 日期: 2025-11-24T18:35:52+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Microsoft Call Center AI，剖析实时电话对话中工具调用、错误恢复及多 bot 规模化的可落地参数与策略。

### [LightRAG：轻量级图基RAG管道工程化：双层检索与低延迟配置](/posts/2025/11/24/lightrag-simple-fast-retrieval/)
- 日期: 2025-11-24T17:19:43+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 资源受限环境下LightRAG简单图RAG管道：双层检索实现低延迟生成，核心参数、部署清单与监控要点。

### [LightRAG 双图边蒸馏融合：低资源快速 RAG 检索核心算法与部署调优](/posts/2025/11/24/lightrag-dual-graph-edge-distillation-fusion/)
- 日期: 2025-11-24T17:04:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双图结构边蒸馏融合，实现高效知识图谱索引与双层检索，工程参数调优与低延迟部署策略，提升 RAG 在低资源环境下的性能。

### [adk-go Code-First 工具包：Go 语言多智能体构建工程化指南](/posts/2025/11/24/adk-go-code-first-go-sdk-multi-agent-toolkit/)
- 日期: 2025-11-24T15:35:14+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 adk-go 的代码优先方法，详解多智能体工作流构建、工具集成与生产部署参数配置。

### [verl RL工具包生产部署工程化：离线RLHF PPO训练与分布式配置](/posts/2025/11/24/verl-rl-toolkit-deployment-engineering/)
- 日期: 2025-11-24T14:08:47+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 聚焦verl框架离线RLHF PPO训练的生产部署策略，给出Docker镜像启动、分布式YAML配置、性能调优参数与监控清单，实现高效工程化落地。

### [LightRAG低资源双图边融合检索：边缘部署参数调优与精度延迟权衡](/posts/2025/11/24/lightrag-low-resource-dual-graph-edge-fusion-deployment-tuning/)
- 日期: 2025-11-24T14:04:53+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG双图低参数边融合检索工程实践：低资源边缘部署配置、延迟调优参数与RAG精度权衡策略。

### [Gibberifier：注入隐形Unicode扰乱LLM Tokenizer的工程实践](/posts/2025/11/24/gibberifier-invisible-unicode-llm-stunner/)
- 日期: 2025-11-24T13:34:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用Gibberifier工具注入零宽度Unicode字符组合，针对LLM tokenizer实现token爆炸与输出崩溃，提供工程阈值调优、检测绕过与防护清单。

### [ADK-Go：代码优先的AI代理评估基准与部署实践](/posts/2025/11/24/adk-go-code-first-agent-evaluation-benchmarks/)
- 日期: 2025-11-24T13:20:08+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于Google ADK-Go的code-first框架，给出AI代理评估基准配置、用户模拟测试清单，以及多代理部署的工程参数。

### [Memori 开源记忆引擎：多代理分层存储与高效检索实践](/posts/2025/11/24/memori-open-source-memory-engine-hierarchical-storage-multi-agent-sync/)
- 日期: 2025-11-24T13:04:10+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 LLM/AI 代理构建开源记忆引擎：分层存储、跨多代理同步、高效检索与长期上下文持久化参数配置。

### [TrendRadar：MCP驱动的多平台热点聚合与AI分析实践](/posts/2025/11/24/trendradar-mcp-multi-platform-ai-analysis/)
- 日期: 2025-11-24T12:08:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于MCP协议的多平台(35+)热点聚合管道，集成13种AI对话分析工具，支持Docker一键部署与多渠道推送的关键参数与工程化清单。

### [LightRAG：双层图检索实现简单快速RAG](/posts/2025/11/24/lightweight-rag-dual-graph-fast-retrieval/)
- 日期: 2025-11-24T10:19:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG通过实体关系图构建和双层检索（local/global），实现低成本、高效RAG，支持增量更新与多存储，无需复杂索引。

### [LightRAG 双图边蒸馏：实体关系图融合的轻量 RAG 核心机制](/posts/2025/11/24/lightrag-dual-graph-edge-distillation/)
- 日期: 2025-11-24T10:04:51+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双图边蒸馏融合实体与关系图，实现高效检索增强生成。详解提取去重、双层检索参数及工程化参数清单。

### [用推测解码实现 Supermaven 式低延迟 AI 代码补全：百万 token 上下文与 sub-200ms 推理](/posts/2025/11/24/low-latency-ai-code-autocomplete-supermaven-speculative-decoding/)
- 日期: 2025-11-24T08:49:28+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向大型代码库的 AI 自动补全，给出推测解码参数、多模型路由与 1M token 上下文管理的工程化实践。

### [Coder：隔离并行代理开发环境的桌面访问与安全工作区隔离](/posts/2025/11/24/coder-isolated-parallel-agentic-dev/)
- 日期: 2025-11-24T07:34:33+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Coder 自托管云开发环境实现隔离并行代理开发，支持 AI 代理安全运行，提供 VS Code 等桌面 IDE 低延迟访问。给出 Terraform 模板配置、访问控制参数与监控要点。

### [Erdős 问题网站集成 AI 代理：例行数学协助工程化](/posts/2025/11/24/ai-agents-for-erdos-problems-routine-assistance/)
- 日期: 2025-11-24T05:34:27+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Terence Tao 实践，探讨 AI 代理在 Erdos 问题网站的集成方案，包括专用提示工程、符号计算钩子与验证参数，实现猜想验证与证明草图自动化。

### [用MCP协议扩展LLM服务器添加交互式UI：工具调用与多步对话实现](/posts/2025/11/24/mcp-apps-interactive-server-ui-extension/)
- 日期: 2025-11-24T04:35:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于MCP协议扩展LLM服务器，集成交互UI实现工具调用、多步对话、状态管理和断线重连，支持实时人机协作的关键工程参数。

### [构建高可用LLM代码服务：分布式监控、自动缩放与故障转移工程实践](/posts/2025/11/24/engineering-resilient-llm-code-services-with-auto-scaling-failover-monitoring/)
- 日期: 2025-11-24T00:19:06+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 借鉴Claude Code宕机事件，提供LLM代码服务分布式监控、K8s自动缩放、熔断fallback等工程参数，确保99.95%可用性防范大规模中断。

### [LightRAG 双图边蒸馏融合检索：低参数低延迟 RAG 系统实现](/posts/2025/11/24/lightrag-dual-graph-edge-distillation-fusion-retrieval/)
- 日期: 2025-11-24T00:04:15+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 LightRAG 双图架构与边蒸馏融合机制，给出图构建、精炼、检索融合的工程参数与优化清单。

### [tosijs-schema：LLM 结构化输出的超轻量 Schema 验证与生成优化](/posts/2025/11/23/tosijs-schema-lightweight-schema-for-llm-outputs/)
- 日期: 2025-11-23T22:48:52+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 工程实践 tosijs-schema 库，实现 LLM JSON 输出的低开销解析、验证与约束生成，提供阈值参数与监控清单。

### [Milvus 云原生向量数据库工程实践：HNSW/IVF-PQ 索引、动态分片、分段自动合并与容错复制](/posts/2025/11/23/milvus-scalable-ann-search-hnsw-ivf-pq-sharding-segments-replication/)
- 日期: 2025-11-23T20:38:05+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Milvus 云原生架构下，通过 HNSW/IVF-PQ 索引实现高效 ANN 搜索；动态分片与分段自动合并支持数据增长；多副本容错复制确保高可用。提供工程参数、阈值与监控要点。