# 分类：ai-systems

> 该分类下的文章按时间倒序排列，便于按主题继续深挖。

## 页面摘要
- 路径: /categories/ai-systems/page/6/
- 当前页: 6 / 75
- 文章总数: 5960
- 当前页文章数: 80

## 快速导航
- [首页](/)
- [分类索引](/categories/)
- [归档索引](/archive/)

## 本页文章
### [Elisym 协议解析：AI Agent 的去中心化发现与链上支付机制](/posts/2026/03/19/elisym-protocol-decentralized-ai-agent-discovery-payments/)
- 日期: 2026-03-19T05:03:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析 Elisym 协议如何通过 Nostr 实现 AI Agent 发现，以及基于 Solana 的链上结算机制，为开发者提供可落地的技术参数。

### [Sashiko：Google推出的Linux内核专用AI代码审查Agent](/posts/2026/03/19/sashiko-linux-kernel-agentic-code-review/)
- 日期: 2026-03-19T04:03:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析Google工程师开发的Sashiko系统：基于LLM的代理式代码审查工具如何覆盖Linux内核补丁流，集成Coccinelle语义分析，实现53%的bug检出率。

### [Qdrant图索引在RAG混合检索中的工程实现：节点构建与边权重调优](/posts/2026/03/19/qdrant-graph-index-rag-hybrid-retrieval/)
- 日期: 2026-03-19T00:04:40+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析Qdrant向量数据库中HNSW图索引的工程实现细节，涵盖节点构建策略与边权重调优方法，为RAG混合检索场景提供可落地的参数配置指南。

### [Superpowers 技能框架的声明式注册与自动触发机制解析](/posts/2026/03/18/superpowers-declarative-registration-and-triggering/)
- 日期: 2026-03-18T20:04:24+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析 Superpowers 技能框架的声明式注册机制、技能定义结构与自动触发逻辑的工程实现细节。

### [Mistral Forge 企业模型训练平台：多模型编排与成本优化架构解析](/posts/2026/03/18/mistral-forge-enterprise-model-training-platform/)
- 日期: 2026-03-18T18:02:20+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入分析 Mistral Forge 端到端模型训练与部署流水线的多模型编排策略、分布式推理缓存机制及全生命周期成本优化方案。

### [Unsloth 梯度检查点实战：70% 显存降低的关键参数与调优策略](/posts/2026/03/18/unsloth-gradient-checkpointing-memory-optimization/)
- 日期: 2026-03-18T16:02:43+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析 Unsloth 如何通过自定义梯度检查点与量化策略实现 LLM 微调显存降低 70%，给出可落地的工程参数与监控要点。

### [AI系统「不学习」的本质：认知科学视角下的自主学习缺失](/posts/2026/03/18/why-ai-systems-dont-learn-cognitive-science-perspective/)
- 日期: 2026-03-18T14:03:00+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从认知科学视角解析 AI 系统「不学习」的本质：自主学习缺失的根源在于缺乏目标重建与元认知，而非数据不足。

### [元提示词驱动的代码生成：GSD 系统中的上下文工程与规格化实践](/posts/2026/03/18/meta-prompting-context-engineering-gsd/)
- 日期: 2026-03-18T13:03:19+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析 GSD 如何通过元提示词、上下文工程与规格化驱动实现自主代码生成，并提供可落地的工程参数与监控要点。

### [代理技能框架的架构设计：从 Superpowers 看可复用 AI 能力单元的构建方法](/posts/2026/03/18/agentic-skills-framework-architecture-design/)
- 日期: 2026-03-18T04:01:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 以 Superpowers 为例，解析代理技能框架的核心架构设计与技能可组合性的工程实现路径。

### [Antfly 分布式图搜索与 RAG 一体化架构：自动关系抽取与混合检索实战](/posts/2026/03/18/antfly-distributed-graph-rag-integration/)
- 日期: 2026-03-18T03:02:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析 Antfly 如何通过自动关系抽取将图索引与混合检索融合，实现 RAG 与图查询的一体化工程实践。

### [未审查 AI 生成代码的自动化验证实践](/posts/2026/03/18/toward-automated-verification-of-unreviewed-ai-generated-code/)
- 日期: 2026-03-18T02:01:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 将代码审查与验证解耦，通过属性测试、突变测试、无副作用约束等自动化手段实现 AI 生成代码的生产级可信度。

### [Deep Agents 子 Agent Spawn 机制与规划工具架构](/posts/2026/03/17/deep-agents-subagent-spawning-planning-tool-architecture/)
- 日期: 2026-03-17T22:02:53+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析 Deep Agents 基于 LangGraph 的子 Agent Spawn 机制与规划工具实现，提供复杂 Agentic 任务编排的工程化参数与最佳实践。

### [纯前端知识图谱与Graph RAG：GitNexus的浏览器端代码智能实现](/posts/2026/03/17/client-side-knowledge-graph-rag/)
- 日期: 2026-03-17T21:02:10+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析GitNexus如何利用WebAssembly在浏览器端构建知识图谱并实现Graph RAG，代码全程本地处理无需服务器。

### [Cursor类AI编程助手的代码质量权衡：速度提升与长期维护成本量化分析](/posts/2026/03/17/cursor-ai-code-quality-tradeoffs/)
- 日期: 2026-03-17T18:02:06+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于arXiv实证研究分析Cursor类AI编程助手在开源项目中的代码质量权衡，量化速度提升与长期维护成本的关系，并给出可操作的工程决策依据。

### [Pyodide浏览器端Python运行时实战：隔离执行环境与AI推理可视化](/posts/2026/03/17/pyodide-browser-python-runtime/)
- 日期: 2026-03-17T17:02:08+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入Pyodide技术架构，解析WebAssembly编译的CPython运行时特性，以及在前端构建隔离执行环境、实现AI模型推理结果本地可视化的工程实践。

### [多模型协作的分布式系统架构：协调协议与容错机制设计](/posts/2026/03/17/multi-language-model-collaboration-distributed-systems-architecture/)
- 日期: 2026-03-17T14:03:08+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从分布式系统视角分析多语言模型协作的架构设计，探讨团队级语言模型的协调协议与容错机制，为实际工程落地提供可操作参数与监控要点。

### [使用 Swift 在 Apple Silicon 上实现 PersonaPlex 全双工语音翻译：实时双向音频处理、低延迟 CoreML 推理与 Metal 加速](/posts/2026/03/05/full-duplex-speech-to-speech-on-apple-silicon-with-swift/)
- 日期: 2026-03-05T20:00:22+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 NVIDIA PersonaPlex-7B 模型，在 Apple Silicon 上用 Swift/MLX 构建全双工 speech-to-speech 系统，提供低延迟双向音频管道、CoreML 优化参数与 Metal 性能调优清单。

### [OpenSandbox 多语言代理沙箱平台：架构与部署参数指南](/posts/2026/03/05/open-sandbox-multi-language-agent-sandboxing/)
- 日期: 2026-03-05T10:51:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Alibaba OpenSandbox，详解多语言 SDK、Docker/K8s 运行时集成，支持 Coding Agents 和 GUI Agents 的安全隔离执行，提供落地部署清单与监控参数。

### [Shannon AI：96% 成功率的无源码 Web 漏洞自动化挖掘系统架构解析](/posts/2026/03/05/shannon-ai-96-percent-success-rate-web-vulnerability-auto-mining-system/)
- 日期: 2026-03-05T04:02:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深度解析 Shannon AI hacker 的四阶段渗透测试架构，揭示其如何结合白盒代码分析与黑盒动态利用实现 96.15% 的漏洞发现成功率。

### [AI Agent工程化构建模式：工具调用、记忆管理与自主决策链设计](/posts/2026/03/04/agentic-engineering-patterns-tool-memory-decision/)
- 日期: 2026-03-04T20:02:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从Simon Willison的Agentic Engineering Patterns项目出发，拆解AI Agent在工具调用、记忆管理与自主决策链上的工程实践设计。

### [用LMCache实现LLM推理KV Cache显存在线融合：零拷贝加速多轮对话](/posts/2026/03/04/lmcache-kv-cache-zero-copy-online-fusion/)
- 日期: 2026-03-04T14:01:40+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向多轮对话场景，解析 LMCache 如何通过零拷贝架构与在线融合机制实现 KV Cache 的跨层级加速。

### [SSD无损推理：动态Draft长度实现LLM加速的工程实践](/posts/2026/03/04/speculative-speculative-decoding-ssd-lossless-inference/)
- 日期: 2026-03-04T12:07:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深度解析Speculative Speculative Decoding（SSD）：通过并行化投机验证循环与动态Draft长度调整，实现无损的LLM推理加速。

### [投机式投机解码(SSD)：LLM推理流水线化的工程参数与部署实践](/posts/2026/03/04/speculative-speculative-decoding-ssd-llm-inference-pipeline/)
- 日期: 2026-03-04T12:01:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深度解析Speculative Speculative Decoding如何通过预投机缓存与验证结果预测，实现draft与verify阶段的流水线重叠，给出工程化关键参数。

### [从零构建亚500ms端到端延迟语音代理：STT、LLM、TTS管道优化](/posts/2026/03/03/building-sub-500ms-e2e-latency-voice-agent-from-scratch/)
- 日期: 2026-03-03T08:00:54+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 实现实时语音交互的关键工程实践：分配延迟预算、流式管道设计与各组件参数调优，确保E2E低于500ms。

### [M4 神经引擎逆向工程：矩阵乘法加速器、稀疏处理与瓦片尺寸优化](/posts/2026/03/03/reverse-engineering-m4-neural-engine-matrix-multiply-accelerators/)
- 日期: 2026-03-03T00:01:11+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 M4 ANE 矩阵乘法硬件加速器设计、SRAM 瓦片限制、推理优化参数，包括 1×1 卷积替代 matmul 的 3 倍加速与 32MB 阈值。

### [Omni：用 Postgres pgvector 构建职场 RAG 搜索与聊天，无需向量数据库](/posts/2026/03/02/omni-postgres-pgvector-workplace-rag-search-chat/)
- 日期: 2026-03-02T20:01:25+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 开源 Omni 项目基于 Postgres ParadeDB + pgvector，实现混合搜索、RAG 聊天和对话历史存储，支持职场工具连接，自托管部署参数与优化要点。

### [Timber：经典机器学习模型的高性能原生推理引擎](/posts/2026/03/02/timber-classical-ml-inference/)
- 日期: 2026-03-02T12:01:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Timber将XGBoost、sklearn等经典ML模型编译为原生C99代码，实现336倍Python加速，提供Ollama式HTTP服务接口的部署参数与优化要点。

### [MCP 协议 vs CLI：在浏览器代理分发循环中的权衡](/posts/2026/03/02/mcp-vs-cli-tradeoffs-for-browser-agent-dispatch-loops/)
- 日期: 2026-03-02T09:47:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对浏览器代理分发循环，剖析 MCP 协议相对于 CLI 的优势：有状态会话、更低延迟、无子进程开销，并提供工程决策参数与监控清单。

### [容器化 AIRI 自托管 Grok：实时语音与 Minecraft/Factorio 游戏代理](/posts/2026/03/02/airi-containerized-multi-modal-game-agents-minecraft-factorio/)
- 日期: 2026-03-02T09:31:51+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 AIRI 开源项目，使用 Docker Compose 容器化自托管 Grok 伴侣，支持边缘设备实时语音聊天及 Minecraft/Factorio 多模态代理自主玩法，提供部署参数、阈值与监控要点。

### [Claude 科学技能工程化：研究数据分析、模拟与金融管道](/posts/2026/03/02/engineering-claude-scientific-skills-research-pipelines/)
- 日期: 2026-03-02T09:17:12+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Claude Scientific Skills 工程化研究管道：数据分析流程、模拟工具、金融模型，包含结构化验证循环与领域特定提示模板。

### [AIRI 灵魂容器工程实践：实时语音多模态与游戏代理边缘部署](/posts/2026/03/02/engineering-airi-souls-container-realtime-voice-multi-modal-game-agents-edge-deployment/)
- 日期: 2026-03-02T09:02:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于开源 AIRI 项目，工程化自托管灵魂容器，实现实时语音聊天、多模态交互及 Minecraft/Factorio 代理，支持边缘设备部署的关键参数与清单。

### [浏览器中构建交互式 Agent 驱动的 MicroGPT 内部解释器](/posts/2026/03/02/build-interactive-agent-driven-microgpt-explainer-browser/)
- 日期: 2026-03-02T08:16:42+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过浏览器事件循环实现 tokenizer、训练循环、KV 缓存和推理的逐步交互可视化，结合简单 JS agent 提供引导式教学。

### [用Rust实现WiFi CSI到DensePose关键点映射：实时姿态与体征阈值调优](/posts/2026/03/02/wifi-densepose-csi-signal-pose-mapping/)
- 日期: 2026-03-02T08:06:15+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于商用WiFi CSI信号，用Rust构建像素无关的DensePose关键点映射管道，实现实时姿态估计与体征监测阈值工程化调优。

### [免费AI聊天Demo：SSE流式响应中动态插广告](/posts/2026/03/02/free-ai-chat-demo-with-ad-insertion-in-sse-streaming-responses/)
- 日期: 2026-03-02T07:47:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向免费AI聊天服务，给出SSE流式广告插入的工程实现、客户端渲染与低延迟变现参数。

### [WiFi DensePose：基于 Rust 管道的信号姿态与生命体征监测](/posts/2026/03/02/wifi-densepose-signal-pose-vitals/)
- 日期: 2026-03-02T04:47:14+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用商用 WiFi CSI 信号，通过 Rust 高性能管道实现实时人体姿态估计、生命体征监测和存在检测。详解管道阶段、关键参数配置与工程化落地要点。

### [复现 CMU 10-202 实验：LLM Agent 分发循环与工具调用](/posts/2026/03/02/reproducing-cmu-10-202-labs-llm-agent-dispatch-loops-with-tool-calling/)
- 日期: 2026-03-02T04:17:21+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 CMU 10-202 从零构建的 LLM，实现工具调用驱动的 Agent 分发循环，支持内存持久化与评估框架，打造鲁棒 AI 系统。

### [OpenSandbox：Docker/K8s 上 GUI Agent 安全评估的统一 Sandbox API](/posts/2026/03/02/open-sandbox-unified-apis-gui-agents-evaluation-on-docker-k8s/)
- 日期: 2026-03-02T04:06:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: OpenSandbox 提供多语言 SDK 和统一 API，支持 Docker/K8s 运行时，用于安全 GUI Agent 执行、评估、AI 代码生成与 RL 训练场景。详解部署参数、监控清单与落地实践。

### [memU SQLite 混合式 episodic+semantic 存储：针对 openclaw 的衰减曲线与召回阈值](/posts/2026/03/02/sqlite-backed-episodic-semantic-memory-memu-decay-openclaw/)
- 日期: 2026-03-02T03:47:22+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 SQLite 实现 memU 的 episodic+semantic 混合内存，支持 openclaw 等代理的 24/7 主动召回。详述衰减曲线、召回阈值参数及爪子机器人聊天状态持久化工程实践。

### [Hello-Agents：实现智能体 Dispatch 循环与工具调用机制](/posts/2026/03/02/hello-agents-dispatch-loop-tool-calling/)
- 日期: 2026-03-02T03:32:03+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 HelloAgents 框架，从零剖析 dispatch 循环，支持工具调用、内存持久化与子代理协作的生产级实现要点。

### [自托管 Superset 作为本地 AI 代理军团 IDE：Claude Code/Codex 分发循环与多 LLM 池化](/posts/2026/03/02/self-host-superset-as-local-ai-agents-ide-swarm/)
- 日期: 2026-03-02T02:47:07+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 自托管 Superset IDE 运行 Claude Code/Codex 等代理军团，支持本地分发循环、多 LLM 池化与 RAG 编排，提供隔离 worktree、并行执行参数与监控要点。

### [AI 代理音频工具包集成：shiehn sas-audio-processor 的低延迟管道实践](/posts/2026/03/02/integrate-shiehn-sas-audio-processor-ai-agents-low-latency/)
- 日期: 2026-03-02T02:16:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 shiehn/sas-audio-processor，探讨 AI 代理中音频处理管道的集成，包括低延迟缓冲管理、格式转换参数与实时交互优化。

### [MCP EOL 后 CLI 替代方案：构建轻量 dispatch loop 实现低开销 Claude code agent](/posts/2026/03/02/mcp-eol-cli-replacement-dispatch-loop-claude-code-agent/)
- 日期: 2026-03-02T01:47:21+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: MCP EOL 后，用 CLI dispatch loop 替代，支持工具调用与上下文管理，提供 Claude code agent 的低开销实现参数与监控要点。

### [DeerFlow 集成沙箱、记忆、工具与子代理：长时工程任务处理](/posts/2026/03/02/deerflow-integrate-sandboxes-memories-tools-subagents-for-long-tasks/)
- 日期: 2026-03-02T01:17:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: DeerFlow 通过沙箱隔离、长时记忆、模块化工具技能和子代理群，支持分钟到小时的研究-编码-创建任务，提供工程化配置参数与监控清单。

### [MobileAgent：视觉语言代理驱动的移动GUI自动化](/posts/2026/03/02/mobile-agent-gui-automation/)
- 日期: 2026-03-02T00:02:06+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于视觉语言模型的MobileAgent，实现移动GUI截屏解析、动作预测与自愈多轮交互，提供工程参数、部署清单与监控要点。

### [Claude XML 标签提示工程基础：嵌套结构实现可靠解析与多步代理](/posts/2026/03/01/claude-xml-tags-fundamentals/)
- 日期: 2026-03-01T23:16:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Claude提示工程中使用XML结构化标签：嵌套设计支持工具分发、分层推理，减少幻觉的多步代理工作流参数与最佳实践清单。

### [从零构建 Agent 运行时：调度循环、子代理协调、工具调用与内存持久化](/posts/2026/03/01/building-agent-runtime-dispatch-loops-subagents-tool-calling-memory-persistence/)
- 日期: 2026-03-01T22:46:53+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Hello-Agents 框架，从零实现 Agent runtime 的核心机制，包括 dispatch 循环、TaskTool 子代理、工具调用协议与 SessionStore 持久化，提供工程参数与监控要点。

### [Rust管道处理WiFi CSI：实时人体姿态与生命体征监测](/posts/2026/03/01/wifi-densepose-rust-pipeline-vital-signs-presence-detection/)
- 日期: 2026-03-01T22:17:15+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用Rust高性能管道从商用WiFi CSI信号提取人体姿态、HR/RR生命体征及存在检测，详述信号处理参数、阈值配置与工程化部署清单。

### [流式 AI 聊天响应中的无缝广告插入：免费 tier 可持续变现工程](/posts/2026/03/01/seamless-ad-insertion-in-streaming-ai-chat-responses/)
- 日期: 2026-03-01T21:02:05+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 工程化流式 AI 聊天中广告插入，实现免费用户可持续收入，平衡 UX 与营收，提供参数阈值、监控清单与回滚策略。

### [用 WiFi CSI 实现生命体征监测与存在检测：工程参数与集成](/posts/2026/03/01/wifi-csi-vital-signs-presence-detection/)
- 日期: 2026-03-01T20:47:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 WiFi DensePose 项目，利用商品 WiFi CSI 信号工程化实时呼吸、心率监测及存在检测，提供信号处理参数、阈值配置与部署清单。

### [DeerFlow SuperAgent 框架：沙箱、记忆、工具技能与子代理的长任务编排实践](/posts/2026/03/01/deerflow-superagent-harness-orchestration/)
- 日期: 2026-03-01T20:31:54+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: ByteDance 开源 DeerFlow 2.0 作为 SuperAgent 运行时，提供沙箱隔离、子代理协作、技能扩展与持久记忆，用于多小时研究、编码、创作任务的工程化部署参数与监控要点。

### [用 SQLite 实现 memU：为 openclaw 等主动代理提供跨会话 episodic/semantic 记忆](/posts/2026/03/01/implement-sqlite-backed-memu-episodic-semantic-memory-proactive-agents/)
- 日期: 2026-03-01T19:46:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 memU 框架，用 SQLite 构建分层 episodic/semantic 记忆，支持 24/7 主动代理意图捕获与自主状态管理，提供 schema、pipeline 与工程参数。

### [Claude 科学技能代理工具包：符号数学与工程模拟模块化构建](/posts/2026/03/01/claude-scientific-skills-agent-toolkit-research-engineering/)
- 日期: 2026-03-01T19:31:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Claude Scientific Skills 构建 Claude 代理，支持 SymPy 符号数学、SciPy 模拟、统计测试及工程分析，通过结构化工具调用实现运行时分发，提供落地参数与监控清单。

### [工程化可扩展混合 RAG 与长上下文管道：打造超越模型智能的 AI 护城河](/posts/2026/03/01/engineering-scalable-hybrid-rag-long-context-ai-moats/)
- 日期: 2026-03-01T18:47:16+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 AI 智能商品化的时代，通过 hybrid RAG 和长上下文窗口构建可扩展上下文管道，实现差异化竞争护城河，提供工程参数与落地清单。

### [工程化无缝 LLM 会话历史迁移至 Claude：保留上下文与工具调用](/posts/2026/03/01/engineering-seamless-llm-session-migration-to-claude/)
- 日期: 2026-03-01T17:31:48+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 详述从 ChatGPT 等导入完整对话历史至 Claude 的工程实践：消息映射、工具保留、压缩参数与部署清单，确保生产连续性。

### [Deer-Flow 子代理切换协议：状态序列化、上下文传递与故障恢复实现](/posts/2026/03/01/deer-flow-subagent-handoff-protocols/)
- 日期: 2026-03-01T17:17:19+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 DeerFlow 中实现子代理手off协议，包括状态 JSON 序列化、隔离上下文传递及故障自动切换的工程参数与监控要点。

### [Shell中代理技能框架的运行时调度循环实现：子代理协调与任务委托](/posts/2026/03/01/runtime-dispatch-loops-in-shell-for-agentic-skills-framework/)
- 日期: 2026-03-01T16:32:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 借鉴Superpowers框架，用纯Shell构建运行时dispatch循环，支持子代理手off、任务分解及开发全流程自动化，提供关键参数、阈值与监控清单。

### [WiFi DensePose：基于 CSI 的实时人体姿态估计 Pipeline](/posts/2026/03/01/wifi-densepose-csi-real-time-pose-estimation/)
- 日期: 2026-03-01T15:47:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 商用 WiFi CSI 信号合成实时人体姿态估计、生命体征监测与存在检测的边缘推理 pipeline 参数与部署要点。

### [Superset 多代理 IDE：本地编排 Claude Code 代理军团实现并行代码任务](/posts/2026/03/01/orchestrating-claude-code-agents-in-superset/)
- 日期: 2026-03-01T14:01:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Superset 作为本地多代理 IDE，协调 Claude Code/Codex 等代理实现并行代码库任务、Git 工作流自动化与自然语言编码，提供工程参数与监控清单。

### [生产级 LLM 文本检测器构建：困惑度、突发性与 N-gram 分析](/posts/2026/03/01/build-production-llm-text-detectors-perplexity-burstiness-n-gram-analysis/)
- 日期: 2026-03-01T13:31:29+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向实时审核管道，结合困惑度评分、突发性指标和 N-gram 分析构建 LLM 生成文本检测器，提供特征提取参数、分类器阈值和部署监控清单。

### [使用 Hermes 模型部署本地 Hermes Agent：可靠工具调用与离线自治任务](/posts/2026/03/01/deploy-local-hermes-agent-hermes-models-tool-calling/)
- 日期: 2026-03-01T12:31:40+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Hermes Agent 和 Hermes-3 模型栈，实现本地离线 LLM agent 的工具调用、函数执行与自治任务，提供 vLLM 参数、沙箱配置与监控清单。

### [Ruflo 分布式 Claude 代理群 RAG 集成与代码支持编排](/posts/2026/03/01/distributed-claude-swarm-rag-orchestration-with-ruflo/)
- 日期: 2026-03-01T12:05:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 企业级 Ruflo 平台下分布式 Claude 代理群的 RAG 管道与原生代码支持，实现自主长运行工作流的协调参数、阈值与监控清单。

### [Ruflo：Claude 多代理 Swarm 编排框架的企业级部署与实时协调实践](/posts/2026/03/01/ruflo-claude-agent-swarm-orchestration/)
- 日期: 2026-03-01T11:16:10+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Ruflo 实现分布式 Claude agent swarm 的编排，支持 RAG 增强、沙箱化工作流与实时多代理协调的企业架构参数与监控要点。

### [Ryzen AI Max+ 集群实现万亿参数 LLM 本地推理：分片、量化和低延迟通信](/posts/2026/03/01/clustering-ryzen-ai-max-for-trillion-llm-local-inference/)
- 日期: 2026-03-01T10:46:29+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于消费级 Ryzen AI Max+ 构建万亿参数 LLM 推理集群，详述模型分片策略、4bit 量化参数及节点间通信优化，实现低延迟本地部署。

### [微型 GPT 从零构建：核心训练循环、分词与单 GPU 高效推理](/posts/2026/03/01/building-microgpt-from-scratch-core-training-loop-tokenization-single-gpu-inference/)
- 日期: 2026-03-01T10:32:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Karpathy microGPT 与 nanoGPT，详解最小 GPT 分词、训练循环及单 GPU 推理参数，提供纯 Python 快速原型参数与监控清单。

### [生产级ANN系统：混合内存-磁盘索引、动态增删与WAL持久化实践](/posts/2026/03/01/production-grade-ann-systems-hybrid-memory-disk-indexing-dynamic-updates-wal-persistence/)
- 日期: 2026-03-01T10:01:57+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 详解生产级近似最近邻（ANN）系统的工程实践，包括混合内存-磁盘索引、动态增删、WAL持久化和背景合并，确保高QPS、亚毫秒延迟与>95%召回率。

### [LLM 确定性编程：固定种子、温度控制与结构化提示](/posts/2026/03/01/deterministic-llm-programming-fixed-seeds-temperature-control/)
- 日期: 2026-03-01T09:47:09+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过固定种子、零温度设置、结构化提示，实现可靠、可重现的 LLM 生成编程逻辑；工程参数、清单与 lint/test 强制策略。

### [通过固定种子、结构化 CoT 和验证循环实现 LLM 代码生成的确定性重现](/posts/2026/03/01/reproducible-llm-code-generation-fixed-seeds-structured-cot-verification-loops/)
- 日期: 2026-03-01T09:31:28+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向生产可靠性的 LLM 代码生成，给出固定种子配置、结构化提示模板与验证循环的工程参数与监控要点。

### [生产级 LLM 应用架构模式：Agent 编排、RAG 流水线与多模型切换](/posts/2026/03/01/production-llm-apps-agent-rag-patterns/)
- 日期: 2026-03-01T07:47:22+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 awesome-llm-apps 100+ 开源示例，总结生产部署的 Agent 协调、RAG 管道、多模型路由与评估框架的关键模式、参数与清单，确保可扩展性与可靠性。

### [生产ANN系统中HNSW与IVF-PQ索引选择：recall@10调优与QPS/内存缩放实测](/posts/2026/03/01/hnsw-vs-ivf-pq-for-production-ann-index-scaling/)
- 日期: 2026-03-01T07:16:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对生产级近似最近邻搜索，实证对比HNSW与IVF-PQ在recall@10、QPS和内存上的表现，给出调优参数、缩放策略与评估清单。

### [AIRI实时语音游戏代理：多模态灵魂边缘部署指南](/posts/2026/03/01/airi-realtime-voice-game-agents-multi-modal-souls-edge-deployment/)
- 日期: 2026-03-01T06:32:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: AIRI自托管Grok伴侣的实时语音与Minecraft/Factorio代理实现，多模态灵魂架构的边缘部署参数与优化要点。

### [消费级GPU上部署Qwen3.5 122B/35B：量化与优化实现Sonnet级性能](/posts/2026/03/01/deploy-qwen3-5-122b-local-consumer-gpus/)
- 日期: 2026-03-01T05:46:53+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过Unsloth GGUF量化、llama.cpp内核融合和分层offload，在RTX 4090等消费级GPU部署Qwen3.5 122B MoE模型，实现接近Claude Sonnet 3.5级本地推理。

### [Rust 实现的 WiFi CSI 密集人体姿态流水线：穿墙实时跟踪](/posts/2026/03/01/rust-wifi-csi-dense-pose-pipeline-for-through-wall-tracking/)
- 日期: 2026-03-01T05:17:21+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 InvisPose 的 Rust 高性能实现，详解从商用路由器提取 CSI 幅度/相位、多 AP 信号融合及 NN 密集姿态解码的工程化 pipeline 与参数配置。

### [生产级近邻搜索系统：磁盘持久化与动态更新工程实践](/posts/2026/03/01/production-ready-nearest-neighbor-disk-persistence-dynamic-updates/)
- 日期: 2026-03-01T05:02:06+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 构建支持磁盘持久化、动态增删、高召回保证与亚毫秒延迟的生产级ANN系统，给出工程参数与监控要点。

### [WiFi DensePose Rust 实现在 Mesh 路由器上的实时姿态跟踪吞吐优化](/posts/2026/03/01/wifi-densepose-rust-mesh-router-throughput-optimization/)
- 日期: 2026-03-01T04:17:14+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 WiFi CSI 的 InvisPose Rust 实现，支持通过墙实时全身姿态跟踪，聚焦 mesh 路由器部署的生产级吞吐量参数与优化策略。

### [Moonshine Voice：NEON 融合边缘 ASR 实时部署指南](/posts/2026/03/01/neon-fused-edge-asr-moonshine-voice/)
- 日期: 2026-03-01T04:06:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 纯 C 实现 ARM NEON 优化的 Moonshine Voice ASR，融合流式 VAD 与 beamsearch，提供边缘设备低延迟转录的工程参数与集成清单。

### [Moonshine ASR C API：NEON 融合 Streaming VAD + Beamsearch，实现 ARM Edge &lt;50ms 低延迟转录](/posts/2026/03/01/moonshine-asr-c-api-neon-fused-streaming-vad-beamsearch-arm-edge-low-latency-transcription/)
- 日期: 2026-03-01T04:02:25+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Moonshine 纯 C API pipeline 中 NEON SIMD 加速 streaming VAD 与 beamsearch 融合，阈值参数调优与多线程调度，实现 ARM 边缘设备实时转录延迟低于 50ms。

### [Claude Code 终端代理：代码库理解、Git 工作流与 MCP 工具集成](/posts/2026/03/01/claude-code-terminal-agent-codebase-git-mcp-integration/)
- 日期: 2026-03-01T03:01:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Claude Code 作为终端代理，实现代码库级理解、自然语言 Git 操作，并通过 MCP 注册表编排外部工具，提供安装配置与优化参数。

### [AIRI 容器化部署：实时语音与游戏代理的工程实践](/posts/2026/03/01/containerized-airi-realtime-voice-deployment/)
- 日期: 2026-03-01T02:17:24+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 AIRI 开源项目，提供容器化部署方案，实现实时语音聊天、游戏代理跨 Web/macOS/Windows，支持灵魂持久化与异构硬件。

### [Moonshine边缘ASR：ARM纯C接口流式推理与低延迟优化](/posts/2026/03/01/moonshine-edge-asr-pure-c-api-streaming-inference-on-arm/)
- 日期: 2026-03-01T02:02:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Moonshine Voice纯C接口ASR引擎在ARM边缘设备的流式推理实现，聚焦低延迟执行、无外部依赖的运行时效率与可移植部署参数。

### [Rivet Actor 每 Actor 嵌入式 SQLite：代理与租户隔离持久化](/posts/2026/03/01/rivet-actors-sqlite-per-agent-persistence/)
- 日期: 2026-03-01T01:16:29+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Rivet Actors 内置 per-actor SQLite 持久化，适用于 AI 代理、多租户游戏后端，提供隔离存储、低延迟访问与工程化参数。