# 分类：ai-systems

> 该分类下的文章按时间倒序排列，便于按主题继续深挖。

## 页面摘要
- 路径: /categories/ai-systems/page/43/
- 当前页: 43 / 75
- 文章总数: 5960
- 当前页文章数: 80

## 快速导航
- [首页](/)
- [分类索引](/categories/)
- [归档索引](/archive/)

## 本页文章
### [Deepnote：实时多用户 Jupyter 笔记本的工程基础设施](/posts/2025/11/23/deepnote-collaborative-jupyter-notebook-infra/)
- 日期: 2025-11-23T20:19:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Deepnote 通过共享内核、计算池化和 Git 无缝集成，实现高效的团队数据科学协作，提供实时多用户 Jupyter 的工程参数与最佳实践。

### [Memori 开源层级多代理内存引擎：嵌入同步与状态持久化实践](/posts/2025/11/23/hierarchical-multi-agent-memory-engine-with-memori/)
- 日期: 2025-11-23T20:11:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向多代理系统，给出 Memori 层级内存管理、代理协作与高效检索的工程参数与集成清单。

### [通过API触发AI代理拨出电话：call-center-ai的工程集成与参数优化](/posts/2025/11/23/api-triggered-ai-bot-outbound-calls/)
- 日期: 2025-11-23T20:05:48+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于Microsoft call-center-ai repo，通过REST API触发AI bot主动拨出电话，支持自定义任务描述、claim schema收集与Azure Communication Services集成。详解payload参数、实时流式对话阈值调优、生产部署清单与成本监控要点。

### [VERL 中 Offline RLHF 工程化：奖励模型蒸馏、Actor-Critic 架构与稳定 PPO 更新](/posts/2025/11/23/verl-offline-rlhf-reward-modeling-actor-critic/)
- 日期: 2025-11-23T18:09:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: VERL 框架下 Offline RLHF 的奖励模型蒸馏、Actor-Critic 架构与 PPO 稳定更新的工程实践与参数配置。

### [在多智能体系统中实现 MCP 协议：OpenAI 与 Anthropic LLM 的无缝上下文共享](/posts/2025/11/23/implementing-mcp-protocol-openai-anthropic-multi-agent-interop/)
- 日期: 2025-11-23T17:18:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 OpenAI/Anthropic 多代理系统，给出 MCP 协议的 Client/Server 实现参数、状态转移清单与监控要点。

### [破解LLM Agent生产难题：工具不可靠、状态易碎与推理不稳的工程对策](/posts/2025/11/23/tackling-llm-agent-production-hardships-pocoo/)
- 日期: 2025-11-23T15:51:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于HN热门帖，剖析pocoo博主分享的三大Agent设计顽疾，提供工具验证、状态压缩、推理投票的可操作参数与监控清单。

### [LightRAG中双图索引边蒸馏融合的低延迟参数调优与工程实现](/posts/2025/11/23/lightrag-dual-graph-edge-distillation-fusion-low-latency-params-tuning/)
- 日期: 2025-11-23T15:04:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG双图机制下边蒸馏融合的核心参数调优策略与低延迟工程清单，实现毫秒级响应。

### [Milvus动态分片与Growing Segment自动Merge策略：亿级向量无中断扩展参数](/posts/2025/11/23/milvus-dynamic-sharding-growing-segment-auto-merge/)
- 日期: 2025-11-23T14:09:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向亿级向量，给出动态分片阈值、growing segment seal/compaction参数与proxy路由优化要点。

### [Call Center AI：AI 代理一键触发外呼电话的 REST API 实现](/posts/2025/11/23/implement-outbound-telephony-rest-api-ai-agents-call-center-ai/)
- 日期: 2025-11-23T14:04:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 无需电话领域专业知识，通过 Microsoft Call Center AI 的简单 REST API，让 AI 代理发起外呼电话，支持自定义目标号码、机器人身份、任务和数据 schema，直接集成 Azure 服务。

### [ADK-Go 多代理编排灵活性：工具链、状态共享与动态路由工程实践](/posts/2025/11/23/adk-go-multi-agent-orchestration-flexibility/)
- 日期: 2025-11-23T13:33:47+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Code-first Go工具包中多代理orchestration灵活机制，包括tool chaining、session state共享与LLM动态路由的工程参数与实践清单。

### [构建 LLM 驱动的代理市场：代币拍卖、任务竞标与激励对齐](/posts/2025/11/23/building-llm-driven-agent-markets-token-auctions-task-bidding-and-incentive-alignment/)
- 日期: 2025-11-23T12:34:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 LLM 代理的去中心化市场，给出代币拍卖、任务竞标、结算账本及涌现协作的工程参数与监控要点。

### [LightRAG 双图检索边知识蒸馏工程实践](/posts/2025/11/23/lightrag-dual-graph-edge-distillation-v2/)
- 日期: 2025-11-23T12:19:22+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG核心双图检索边知识蒸馏机制详解，包括索引构建、检索融合参数与低延迟RAG落地要点。

### [TrendRadar：多平台热点聚合 + MCP AI 的13种舆情分析工具工程化落地](/posts/2025/11/23/trendradar-mcp-ai-hotspot-analysis-engineering/)
- 日期: 2025-11-23T10:08:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: TrendRadar 多平台热点聚合与 MCP AI 13 分析工具的工程参数、部署阈值、监控策略与落地清单。

### [用 ADK-Go 实现代码优先的 AI 代理构建：编排与基准测试灵活控制](/posts/2025/11/23/code-first-adk-go-agent-toolkit/)
- 日期: 2025-11-23T10:03:28+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Google ADK-Go 的 Go 工具包，提供代码定义代理逻辑、工具集成、多代理编排与基准评估的工程参数与落地清单。

### [LightRAG 双图 edge-distillation 融合参数调优：阈值、排序与低延迟高召回实现](/posts/2025/11/23/lightrag-dual-graph-edge-distillation-fusion-params-tuning/)
- 日期: 2025-11-23T09:48:24+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 双图检索中 edge-distillation 融合的核心参数调优指南，包括 cosine_threshold、top_k 排序聚合策略，实现低延迟高召回 RAG 检索。

### [分层扩散模型生成一致性多视图3D世界](/posts/2025/11/23/layered-diffusion-3d-world-generation/)
- 日期: 2025-11-23T09:33:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于分层扩散与高斯溅射，从文本生成支持动态编辑的沉浸式3D世界，提供工程参数、阈值与落地清单。

### [Memori：多代理分层记忆同步的SQL原语与工程参数](/posts/2025/11/23/memori-multi-agent-hierarchical-memory-sync/)
- 日期: 2025-11-23T09:23:00+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Memori通过SQL-native分层记忆与低开销同步原语，支持多代理跨会话协作，提供关键配置与监控实践。

### [LightRAG 双图检索融合参数调优：实现亚毫秒级 RAG 延迟](/posts/2025/11/23/lightrag-retrieval-fusion-params-tuning-low-latency/)
- 日期: 2025-11-23T07:50:27+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 详解 LightRAG dual-graph edge fusion hyperparams 调优策略，包括 batch-threshold、token limits 与 sharding deployment，实现 sub-ms 检索延迟的工程参数与监控要点。

### [Vibe Scaffold：AI编码代理规格向导](/posts/2025/11/23/vibe-scaffold-ai-coding-agent-spec-wizard/)
- 日期: 2025-11-23T06:08:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过Prompt-chaining UI向导，将模糊想法解析为AI代理的结构化规格：需求分解、架构图、测试用例、部署配置，实现LLM编排下的高效idea-to-spec转换。

### [Meta WorldGen：文本生成沉浸式3D世界的分层扩散管道](/posts/2025/11/23/meta-worldgen-text-to-immersive-3d-worlds-layered-diffusion/)
- 日期: 2025-11-23T05:34:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 解析Meta WorldGen的分层生成流程，给出工程化参数与一致性监控要点，支持50×50米可交互场景构建。

### [ADK-Go 代理评估基准与部署实践：成功率延迟监控与持久状态管理](/posts/2025/11/23/adk-go-agent-evaluation-benchmarks-and-deployment/)
- 日期: 2025-11-23T03:49:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于ADK-Go的Go语言AI代理框架，给出工具调用成功率/延迟评估基准、Cloud Run部署钩子及持久状态/容错参数，实现生产级脱离Python LLM绑定的控制。

### [LightRAG 双图边蒸馏索引：实体关系提取与生产融合参数](/posts/2025/11/23/lightrag-dual-graph-edge-distillation/)
- 日期: 2025-11-23T02:04:51+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过 LLM 驱动的双图边蒸馏，实现低延迟 RAG 的实体-关系索引、1-hop 扩展与融合优化，给出生产级参数配置与监控清单。

### [LightRAG 通过边提炼实现双图索引的低延迟检索融合：参数调优、阈值选择与展开重构](/posts/2025/11/23/lightrag-edge-distillation-fusion-params/)
- 日期: 2025-11-23T01:49:24+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG利用关系边提炼构建实体-关系双图索引，在RAG管道中实现低延迟检索融合，提供参数调优、相似度阈值选择与1-hop展开重构的工程化指南。

### [iPhone音频谱图与运动传感器融合LLM提示：零样本活动识别](/posts/2025/11/23/fuse-iphone-audio-motion-llm-zero-shot-activity-recognition/)
- 日期: 2025-11-23T01:18:36+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于苹果后期多模态融合研究，给出iPhone上音频谱图与IMU数据转文本prompt的工程实现、参数调优与部署清单。

### [通过API驱动的AI电话代理：号码配置与实时转录集成](/posts/2025/11/23/api-driven-ai-phone-calls-with-configurable-numbers/)
- 日期: 2025-11-23T00:19:21+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Microsoft Call-Center-AI，解析简单 API 发起 outbound calls 的参数配置，支持 inbound bot 直拨与实时对话转录工具集成要点。

### [AI 代理 API 外呼电话：呼叫中心 LLM 与电话集成参数与架构](/posts/2025/11/22/api-outbound-calls-from-ai-agents-in-call-centers/)
- 日期: 2025-11-22T23:48:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Call Center AI，详解 API 驱动外呼实现：POST 参数配置、实时流式架构、Azure 部署清单与优化阈值。

### [MRI物理前向模型实现：支持展开优化的高锐度重建](/posts/2025/11/22/mri-physics-forward-model-unrolled-reconstruction/)
- 日期: 2025-11-22T23:34:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 详解MRI信号物理模拟前向模型的PyTorch实现，用于unrolled优化循环，提供阈值参数与落地清单。

### [ADK-Go：代码优先的代理评估框架与部署实践](/posts/2025/11/22/adk-go-code-first-agent-evaluation/)
- 日期: 2025-11-22T23:18:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Google 开源 ADK-Go 工具包，代码优先构建复杂 AI 代理，集成评估框架实现性能量化，并配置灵活部署管道的关键参数与监控清单。

### [TiDAR：扩散思考、自回归表达的混合生成架构](/posts/2025/11/22/tidar-think-diffusion-talk-autoregression/)
- 日期: 2025-11-22T22:49:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: TiDAR在单一前向传播中融合扩散并行草稿生成与自回归拒绝采样，实现LLM生成吞吐量4.71~5.91倍提升，同时保持AR级质量，详解训练参数、推理优化与部署清单。

### [Pocoo 作者揭秘：代理设计三大陷阱与生产化解决方案](/posts/2025/11/22/pocoo-author-agent-design-pitfalls-and-production-fixes/)
- 日期: 2025-11-22T22:03:51+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于Pocoo作者经验，针对AI代理不可靠工具、状态持久化脆弱、推理不稳定痛点，给出生产部署参数、监控清单与回滚策略。

### [无服务器 AI 代理出站电话编排：API 集成 STT/TTS 与实时状态管理](/posts/2025/11/22/serverless-outbound-telephony-ai-agents/)
- 日期: 2025-11-22T21:50:14+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 Microsoft Call Center AI 项目，工程化实现 serverless 出站电话呼叫，重点优化语音管道容错、实时对话状态管理和监控参数，提升 AI 代理可靠性。

### [LLM Agent 架构核心工程难题：工具调用不可靠、状态脆弱与多步推理瓶颈](/posts/2025/11/22/llm-agent-design-challenges-unreliable-tools-fragile-state-reasoning/)
- 日期: 2025-11-22T21:33:54+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 LLM Agent 三大痛点，提供工具调用验证清单、状态持久化参数与多步规划监控策略，实现可靠生产部署。

### [RT-DETR：端到端 Transformer 实现低延迟无锚点实时检测，边缘设备胜过 YOLO](/posts/2025/11/22/rt-detr-real-time-anchor-free-detection-outperforms-yolo-edge/)
- 日期: 2025-11-22T21:18:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: RT-DETR 通过高效混合编码器和不确定性最小化查询选择，实现低延迟无锚点实时目标检测，在边缘设备上超越 YOLO，提供部署参数与监控要点。

### [RT-DETR：端到端Transformer实现实时目标检测，边缘硬件胜过YOLO](/posts/2025/11/22/rt-detr-end-to-end-transformer-real-time-detection-beats-yolo-on-edge/)
- 日期: 2025-11-22T21:03:51+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: RT-DETR通过Transformer解码器绕过锚点和NMS，在边缘硬件上实现更快实时检测，匹配YOLO精度，提供部署参数与优化清单。

### [AI 代理运行时陷阱与防护栏设计](/posts/2025/11/22/ai-agents-runtime-pitfalls-and-guardrails/)
- 日期: 2025-11-22T20:49:08+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 AI 代理运行时痛点如工具调用不稳、状态漂移与循环规划，提供结构化错误恢复和工程化防护栏参数。

### [权重稀疏 Transformer 实现可解释神经电路：剪枝与桥接工程参数](/posts/2025/11/22/weight-sparse-transformers-interpretable-circuits/)
- 日期: 2025-11-22T19:33:13+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过权重稀疏训练揭示 Transformer 内部电路，提供 L0 正则、mean ablation 验证及桥接对齐的具体参数与监控清单。

### [Serverless 出站电话 AI 代理：Azure OpenAI 与电话集成编排](/posts/2025/11/22/serverless-ai-agents-outbound-telephony-orchestration/)
- 日期: 2025-11-22T18:20:08+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Azure 的 serverless 出站呼叫中心 AI 代理，支持 API 触发拨号与实时语音交互，提供参数配置与监控要点。

### [用 ADK-Go 实现代码优先的代理编排：多代理工作流与工具集成](/posts/2025/11/22/code-first-agent-orchestration-with-adk-go/)
- 日期: 2025-11-22T18:09:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Google ADK-Go 开源工具包，聚焦 code-first 方式构建复杂 AI 代理：详解顺序/并行/循环代理、多步推理工具集成及运行时控制参数。

### [LightRAG 边缘蒸馏双图融合：低延迟 RAG 检索实践](/posts/2025/11/22/lightrag-edge-distillation-dual-graph-fusion/)
- 日期: 2025-11-22T17:04:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过实体-关系双图索引与轻量学生模型蒸馏，实现边缘设备高效融合检索，提供 hybrid 模式参数与部署清单。

### [LightRAG嵌入蒸馏：双图融合下的边缘RAG低延迟参数与阈值](/posts/2025/11/22/lightrag-embedding-distillation-edge-rag-dual-graph-fusion/)
- 日期: 2025-11-22T15:35:03+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过教师-学生嵌入蒸馏与双图融合，在LightRAG框架下实现边缘设备低延迟RAG，详述训练阈值、融合参数与部署清单。

### [矩阵乘法结构丑陋的索引顺序：对称张量重构与AI加速器优化](/posts/2025/11/22/matrix-multiplication-index-order-ugliness-symmetric-reform/)
- 日期: 2025-11-22T12:50:22+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析标准矩阵乘法索引嵌套的认知与性能双重丑陋，通过对称张量重构实现直观计算图与缓存最优的AI加速器实现。

### [LightRAG 双图索引与嵌入蒸馏：边缘设备 1GB RAM 内低延迟多跳检索](/posts/2025/11/22/lightrag-dual-graph-indexing-edge-distillation/)
- 日期: 2025-11-22T12:33:42+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双图索引结合嵌入蒸馏，实现 1GB RAM 内边缘设备低延迟多跳检索，提供优化参数、部署清单与监控要点。

### [构建物理信息前向模型：MRI信号模拟与高锐度重建](/posts/2025/11/22/physics-informed-forward-model-for-mri-signal-simulation-and-sharp-reconstruction/)
- 日期: 2025-11-22T11:19:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于可微分Bloch模拟器，实现MRI前向信号生成与逆向优化，提供硬件先验参数，提升图像锐度与重建质量。

### [Milvus 云原生向量数据库：HNSW+IVF-PQ 亿级 ANN 搜索与动态分片容错](/posts/2025/11/22/milvus-cloud-native-vector-db-hnsw-ivf-pq-dynamic-sharding-fault-tolerant-replication/)
- 日期: 2025-11-22T10:08:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Milvus 通过云原生设计与 HNSW+IVF-PQ 索引，实现亿级规模下低延迟 ANN 搜索，结合动态分片和高可用复制，确保生产级可靠性。

### [LightRAG 简约无图检索融合：亚秒级 RAG 延迟与低参数边缘部署实践](/posts/2025/11/22/lightrag-simple-fast-retrieval-augmented-generation/)
- 日期: 2025-11-22T09:50:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 LightRAG EMNLP 论文核心 baseline：naive 模式纯向量检索+简单融合，无需复杂图索引，实现 sub-second 延迟，附低参数配置、监控阈值与边缘部署清单。

### [Waymo 无人物流围栏扩展工程：安全验证管道与舰队扩展](/posts/2025/11/22/engineering-waymo-driverless-geofence-expansion-safety-pipelines-and-fleet-scaling/)
- 日期: 2025-11-22T08:48:13+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: DMV 批准后 Waymo 扩展 geofence，详析安全验证管道、动态 HD 地图更新及舰队部署参数。

### [用 Flask 和浏览器前端构建实时德州扑克 AI 对战游戏](/posts/2025/11/22/building-real-time-texas-holdem-ai-flask-browser/)
- 日期: 2025-11-22T07:48:00+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Flask-SocketIO 实现实时多人德州扑克，支持多难度 AI 对手、豪华赌场 UI，提供完整游戏逻辑、部署参数与监控清单。

### [用 ADK-Go 代码优先构建灵活 AI 代理：工具与行为精确控制](/posts/2025/11/22/code-first-go-toolkit-for-flexible-ai-agents-adk/)
- 日期: 2025-11-22T07:18:25+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Google ADK-Go 工具包，探讨 code-first 方式下代理工具集成与行为管理的工程参数与最佳实践。

### [Memori 多代理记忆协调：分层嵌入与同步检索实现](/posts/2025/11/22/memori-multi-agent-memory-coordination/)
- 日期: 2025-11-22T07:03:08+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向多 LLM 代理系统，给出 Memori 开源引擎的分层记忆同步、冲突解析与协调工程实践与参数清单。

### [集成MCP的TrendRadar：AI驱动的多平台新闻热点聚合与分析](/posts/2025/11/22/trendradar-mcp-news-aggregation/)
- 日期: 2025-11-22T05:02:36+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: TrendRadar借助MCP协议实现AI新闻分析，支持35平台热点监控、情感趋势分析、相似检索，Docker部署，企业微信/Telegram推送，高效解决信息过载。

### [用 VERL 实现 LLM 离线 RLHF 流水线：奖励建模与 PPO Actor-Critic 优化](/posts/2025/11/22/using-verl-for-llm-offline-rlhf-pipeline-reward-modeling-actor-critic-ppo/)
- 日期: 2025-11-22T04:33:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 详解 VERL 在离线 RLHF 中的完整 pipeline：数据准备、reward modeling、actor-critic 训练循环、PPO 参数优化与评估，确保高效偏好对齐。

### [构建 StreetView 全景语义索引系统：文本到全景的 embedding 匹配与渲染](/posts/2025/11/22/building-streetview-panorama-semantic-search-system/)
- 日期: 2025-11-22T02:48:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于多模态 embedding 实现 StreetView 全景语义搜索，包括索引构建、查询匹配与曲面投影渲染的工程参数与落地清单。

### [工程化 AI 编码 CLI：本地终端、远程服务器与代理控制的标准化实践](/posts/2025/11/22/ai-coding-cli-control-spectrum/)
- 日期: 2025-11-22T01:03:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 AI 编码场景，工程化 CLI 接口设计要点，包括本地终端集成、远程服务器代理控制及 MCP 等协议标准化参数与落地清单。

### [LightRAG 双图索引与检索融合及低延迟参数实现高效简单 RAG](/posts/2025/11/22/lightrag-dual-graph-indexing-retrieval-fusion-low-latency-params/)
- 日期: 2025-11-22T00:32:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过实体-关系双图索引与 hybrid/mix 检索融合，提供低延迟参数配置，实现无重依赖的简单高效 RAG 管道。

### [OLMo 3 端到端模型开发流程优化：加速开源 AI 领导力的数据、训练与评估管道](/posts/2025/11/22/optimizing-end-to-end-model-flow-for-olmo-3-accelerating-open-source-ai-via-efficient-data-training-and-eval-pipelines/)
- 日期: 2025-11-22T00:18:51+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 OLMo 3 的完整模型流，从数据清洗到 RL 后训练，给出高效管道参数与落地清单。

### [Memori：SQL原生分层嵌入记忆引擎核心实现](/posts/2025/11/22/implement-memori-hierarchical-embedding-memory-engine/)
- 日期: 2025-11-22T00:08:09+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析Memori的分层存储、嵌入检索、多代理协作与低开销同步原语，给出LLM代理记忆引擎的工程参数与部署清单。

### [Deno沙箱实现本地MCP模式代码执行：安全隔离与权限控制](/posts/2025/11/21/deno-sandboxes-for-local-mcp-mode/)
- 日期: 2025-11-21T21:03:48+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于mcp-deno-sandbox项目，在Deno沙箱中运行本地MCP模式，支持JS/TS/Python代码执行，提供运行时权限与模块隔离参数配置。

### [用 ADK-Go code-first 实现代理评估框架与部署管道：指标追踪、A/B 测试与可扩展编排](/posts/2025/11/21/adk-go-agent-evaluation-deployment-pipelines/)
- 日期: 2025-11-21T20:09:05+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 ADK-Go 的代码优先方法，构建代理评估框架与部署管道，集成指标追踪、A/B 测试及可扩展编排参数与监控清单。

### [LightRAG 双图嵌入蒸馏至边缘检索：知识融合与量化训练参数](/posts/2025/11/21/lightrag-embedding-distillation-edge-retrieval/)
- 日期: 2025-11-21T18:18:11+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG双图嵌入通过知识融合蒸馏至轻量student模型，实现sub-100ms边缘RAG延迟。详解QAT参数、KD损失设计与监控阈值。

### [LightRAG 双图索引与检索融合：资源受限设备低延迟 RAG 参数配置](/posts/2025/11/21/lightrag-dual-graph-indexing-retrieval-fusion-low-latency-rag-parameters/)
- 日期: 2025-11-21T18:03:21+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过实体本地图与关系全局图的双层索引，实现高效检索融合，支持 hybrid/mix 模式。针对资源设备，给出 chunk 分割、top_k、reranker 参数及监控阈值，确保低延迟 LLM 增强。

### [工程化开源LLM全生命周期管线：OLMo数据飞轮、分布式训练与分阶段发布](/posts/2025/11/21/engineering-olmo-open-source-llm-lifecycle-pipeline/)
- 日期: 2025-11-21T16:49:14+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析AllenAI OLMo框架端到端开源LLM管线：Dolma数据飞轮curation、FSDP分布式训练10B参数模型、Catwalk评估基准及渐进发布策略，提供工程参数与监控要点。

### [TrendRadar 集成 MCP：13 个 AI 工具实现新闻趋势追踪与情感分析](/posts/2025/11/21/trendradar-mcp-integration-13-ai-tools-news-trend-sentiment-analysis/)
- 日期: 2025-11-21T16:08:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: TrendRadar 通过 MCP 协议集成 13 个 AI 工具，支持自然语言查询 35 平台新闻数据，进行趋势追踪、情感分析与相似检索；提供 Docker 部署与微信推送参数，实现舆情监控工程化。

### [OLMo 开源模型全生命周期工程管道：从数据准备到部署的透明实践](/posts/2025/11/21/olmo-open-source-model-lifecycle-pipeline/)
- 日期: 2025-11-21T15:47:57+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: AllenAI OLMo 框架下，从 Dolma 数据清洗到 FSDP 训练、Open Instruct 微调与 HF 部署的工程参数、监控要点与可复现清单。

### [构建 AI 驱动文件光标：语义搜索与多文件导航工程实践](/posts/2025/11/21/ai-file-cursor-semantic-search-multi-file-navigation/)
- 日期: 2025-11-21T15:18:22+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Cursor AI，给出语义搜索、多文件导航、智能重构的工程参数、清单与监控要点。

### [使用 Azure/OpenAI 构建 API 驱动的外呼 AI 代理：语音合成、ASR 与无服务器电话路由](/posts/2025/11/21/build-api-driven-ai-agents-for-outbound-phone-calls-with-azure-openai/)
- 日期: 2025-11-21T14:48:13+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Microsoft Call-Center-AI 开源项目，实现 API 触发的外呼 AI，支持实时 STT/TTS、RAG 增强与 serverless 部署的关键参数与监控要点。

### [LightRAG 双图检索融合：低资源环境下高效 RAG 实现](/posts/2025/11/21/lightrag-dual-graph-retrieval-fusion/)
- 日期: 2025-11-21T14:34:11+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双图（实体-关系）结构实现简单高效的检索融合，支持低资源快速部署，提升多源 chunk 召回与生成质量。

### [希尔伯特空间将函数视为向量：内积相似度与核技巧工程实践](/posts/2025/11/21/hilbert-space-functions-as-vectors/)
- 日期: 2025-11-21T12:33:16+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 函数嵌入希尔伯特空间计算相似性，核技巧参数用于代码搜索优化与ML特征提取。

### [Call Center AI 出站电话 API：AI 代理直拨与实时对话工程实践](/posts/2025/11/21/call-center-ai-outbound-telephony-api/)
- 日期: 2025-11-21T11:48:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Microsoft Call Center AI 项目，详解出站电话 API 的工程实现，包括拨号参数、实时 STT/TTS 流式集成与对话编排阈值配置。

### [使用 Azure 和 OpenAI 构建无服务器 AI 外呼语音编排](/posts/2025/11/21/building-serverless-ai-outbound-voice-orchestration-with-azure-and-openai/)
- 日期: 2025-11-21T08:46:29+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Azure Communication Services 和 OpenAI Realtime API 构建无服务器 API，实现 AI 发起的电话呼叫，支持动态对话流、低延迟语音合成和自然语言路由。

### [使用 Memori 实现多代理记忆协调：同步检索与冲突解决](/posts/2025/11/21/using-memori-for-multi-agent-memory-coordination-synchronized-retrieval-and-conflict-resolution/)
- 日期: 2025-11-21T08:31:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向多代理 LLM 系统，给出 Memori 记忆同步机制、向量嵌入集成方案与冲突处理参数的工程实践。

### [LLM指导的迭代CUDA内核精炼：通过自动融合与平铺实现GEMM操作17倍加速](/posts/2025/11/21/llm-guided-iterative-cuda-kernel-refinement-fusion-tiling/)
- 日期: 2025-11-21T08:02:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向GEMM操作的CUDA内核优化，给出LLM引导的迭代精炼流程、融合平铺参数与验证要点，实现17x加速。

### [使用 LLM 迭代生成 CUDA 内核：实现 17 倍性能优化](/posts/2025/11/21/using-llms-to-iteratively-generate-cuda-kernels-for-17x-performance-optimization/)
- 日期: 2025-11-21T07:31:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 LLM 和进化算法自动优化 CUDA 内核，针对 ML ops 实现硬件特定性能提升，提供迭代参数和监控要点。

### [使用 AI 代理构建可扩展的出站电话集成管道](/posts/2025/11/21/building-scalable-outbound-telephony-integration-with-ai-agents/)
- 日期: 2025-11-21T06:31:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 AI 代理和 Azure Communication Services 构建 API 驱动的出站电话管道，支持语音合成、动态路由和 Twilio 等集成，提供工程化参数与落地清单。

### [Milvus 中 HNSW 和 IVF-PQ 索引优化：亿级向量低延迟 ANN 搜索与动态构建过滤](/posts/2025/11/21/optimize-hnsw-ivf-pq-milvus-low-latency-ann/)
- 日期: 2025-11-21T06:16:47+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Milvus 中 HNSW 和 IVF-PQ 索引的优化策略，包括动态索引构建、查询时过滤和参数调优，实现亿级向量的高效低延迟 ANN 搜索。

### [将 Kagi AI 助手与搜索索引集成，实现个性化查询解析](/posts/2025/11/21/integrate-kagi-ai-assistants-with-search-indexing-for-personalized-query-resolution/)
- 日期: 2025-11-21T06:06:33+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文探讨如何将领域特定 AI 助手与搜索索引结合，通过 API 钩子实现个性化查询解析和自动化任务执行。提供工程参数、监控要点和落地清单。

### [使用 VERL 的 HybridFlow 构建混合 RL 工作流：LLM 微调的模块化策略优化](/posts/2025/11/21/verl-hybrid-rl-workflows-for-llm-fine-tuning/)
- 日期: 2025-11-21T03:46:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: VERL 的 HybridFlow 框架通过混合控制器模型，支持 RL 阶段的灵活组合，从离线数据生成到在线更新，实现 LLM 高效对齐。提供模块化 API 和设备映射参数，提升生产级 RLHF 吞吐量达 20 倍以上。

### [LightRAG 中的嵌入蒸馏：轻量级学生模型实现边缘设备低延迟检索](/posts/2025/11/21/embedding-distillation-in-lightrag-lightweight-student-models-for-low-latency-retrieval-on-edge-devices/)
- 日期: 2025-11-21T03:32:16+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过嵌入蒸馏技术，将大型教师嵌入模型的知识转移到小型学生模型中，集成到 LightRAG 系统，实现边缘设备上的低延迟 RAG 检索，同时保持检索准确性。

### [VERL 中异步 Actor-Critic 更新用于多轮对话实时在线对齐](/posts/2025/11/21/async-actor-critic-updates-in-verl-for-real-time-online-alignment/)
- 日期: 2025-11-21T02:47:11+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 VERL 框架中异步 Actor-Critic 更新机制，实现多轮 LLM 对话的实时偏好优化，支持低延迟对齐而无需完整离线重训，提供工程化参数与监控要点。

### [AI驱动的文件导航光标界面开发](/posts/2025/11/21/ai-driven-file-navigation-cursor-interface/)
- 日期: 2025-11-21T02:32:11+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨Poly AI文件导航工具的开发，聚焦上下文感知建议和多文件操作的参数配置与工程实践。

### [利用 ADK-Go 的代码优先方法定义 AI 代理工具与编排管道](/posts/2025/11/21/code-first-agent-orchestration-in-adk-go/)
- 日期: 2025-11-21T01:17:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 ADK-Go 中 Go 语言的类型安全代码优先方法，用于定义 AI 代理工具、行为和多步推理编排管道，提供直接灵活控制的工程实践。
