# 分类：ai-systems

> 该分类下的文章按时间倒序排列，便于按主题继续深挖。

## 页面摘要
- 路径: /categories/ai-systems/page/39/
- 当前页: 39 / 75
- 文章总数: 5960
- 当前页文章数: 80

## 快速导航
- [首页](/)
- [分类索引](/categories/)
- [归档索引](/archive/)

## 本页文章
### [Docker部署TrendRadar：35平台热点聚合与MCP AI分析管道](/posts/2025/12/04/docker-deployed-trendradar-mcp-ai-analysis/)
- 日期: 2025-12-04T03:04:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于Docker的TrendRadar部署方案，聚合35+平台热点，支持MCP协议AI工具进行趋势追踪、情感分析与多渠道通知，实现工程化舆情监控。

### [Phind mini-app 答案：代码合成与 iframe 嵌入的交互探索](/posts/2025/12/04/phind-mini-app-answers-code-synthesis-iframe-embedding/)
- 日期: 2025-12-04T02:21:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Phind 为每个搜索答案生成交互式 mini-app，通过 AI 代码合成和 iframe 安全嵌入，实现可执行探索，提供工程参数与监控要点。

### [Phind mini-app 答案：代码合成与 iframe 嵌入的交互探索](/posts/2025/12/04/phind-mini-app-answers-code-synthesis-iframe-exploration/)
- 日期: 2025-12-04T02:20:29+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Phind 为每个搜索答案生成交互式 mini-app，通过 AI 代码合成和 iframe 安全嵌入，实现从静态文本到可执行探索的跃升，提供工程化参数与监控要点。

### [Qwen3-VL 长视频帧采样与时间戳精确定位工程实践](/posts/2025/12/04/qwen3-vl-long-video-frame-sampling-and-timestamping/)
- 日期: 2025-12-04T00:09:47+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Qwen3-VL 面向 2 小时视频，给出智能帧采样、时间戳编码与 token 预算优化的工程参数与监控要点。

### [使用Wang Tiles实现无缝无限高斯溅射纹理](/posts/2025/12/03/seamless-infinite-gaussian-splatting-textures-via-wang-tiles/)
- 日期: 2025-12-03T23:33:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向广阔辐射场世界，给出Wang平铺生成可无限拼接3D高斯的技术参数与工程清单，无边界伪影。

### [TrendRadar：35平台热点聚合+MCP AI分析pipeline的工程部署与推送集成](/posts/2025/12/03/multi-platform-hotspot-aggregation-mcp-ai-analysis-pipeline-docker-n8n-push/)
- 日期: 2025-12-03T22:43:30+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 详解TrendRadar工程实践：35平台(抖音/知乎/B站等)热点监控+MCP 14工具AI分析，支持Docker部署、企业微信/Telegram推送的关键参数与优化。

### [Qwen3-VL 长视频帧采样与时间戳精确定位工程实践](/posts/2025/12/03/qwen3-vl-long-video-frame-sampling-and-timestamping/)
- 日期: 2025-12-03T22:24:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对2小时视频处理，优化帧采样策略、关键帧检测阈值及文本时间戳对齐，实现亚秒级细节定位与高效token利用。

### [ADK-Go 中并行工具分发与状态检查点恢复机制](/posts/2025/12/03/parallel-tool-dispatch-state-checkpointing-in-adk-go/)
- 日期: 2025-12-03T22:17:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Go 的 AI agent 工具包 ADK-Go，实现 parallel tool dispatch 通过 ParallelAgent，利用 goroutines 并发执行工具调用；state checkpointing 依赖 session 模块，支持长运行会话的故障恢复与 tracing 监控。

### [Call Center AI 的状态化多轮电话管道：实时对话、Claim 收集与持久化](/posts/2025/12/03/stateful-multi-turn-phone-pipeline-in-call-center-ai/)
- 日期: 2025-12-03T20:21:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Microsoft Call Center AI，解析 API 触发状态化多轮电话代理的核心管道，支持实时 ASR/TTS、Claim schema 数据收集、断线续传与人工转接，实现客服全链路自动化。

### [LightRAG 双本地-全局图索引与查询融合蒸馏：在低内存边缘设备上实现亚秒级 RAG 延迟](/posts/2025/12/03/lightrag-dual-local-global-graph-indexing-query-fusion-distillation-subsecond-rag-latency-edge-devices/)
- 日期: 2025-12-03T19:46:29+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双层图索引、查询融合蒸馏和模型量化，在内存不足 6GB 的边缘设备上实现亚秒级 RAG 延迟，提供参数配置与部署清单。

### [Anthropic收购Bun后：Zig驱动的高吞吐JS Runtime赋能AI代理Serverless部署](/posts/2025/12/03/anthropic-bun-serverless-js-runtime-ai-agent-deployment/)
- 日期: 2025-12-03T19:04:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Anthropic收购Bun后，利用Zig构建的高性能JS运行时优化AI代理的serverless部署与流式响应，提供具体参数配置与监控要点。

### [LightRAG 双图索引+查询融合蒸馏：高效RAG落地参数与监控](/posts/2025/12/03/lightrag-dual-graph-query-fusion-distillation-pipeline/)
- 日期: 2025-12-03T18:50:15+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 LightRAG dual-graph 构建、hybrid 查询融合与 KV 蒸馏机制，提供初始化参数、阈值清单与生产回滚策略。

### [ADK-Go 代码优先并行工具分发：状态检查点机制与运行时控制参数](/posts/2025/12/03/adk-go-code-first-parallel-tool-dispatch/)
- 日期: 2025-12-03T18:16:29+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 ADK-Go SDK 实现 AI 代理并行工具调度，详解状态持久化检查点配置和运行时评估阈值，提供完整工程清单。

### [构建鲁棒手写识别管道：连笔分段、倾斜归一化与语言模型融合](/posts/2025/12/03/robust-htr-pipeline-cursive-segmentation-slant-lm-fusion/)
- 日期: 2025-12-03T17:13:03+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对多样脚本的手写文本识别（HTR），给出连笔笔画分段、仿射变换倾斜校正及上下文语言模型融合的工程参数与监控要点，实现>95%准确率。

### [Ecosia最低碳足迹AI搜索工程化：低功耗模型推理、绿色数据中心调度与可再生能源集成优化](/posts/2025/12/03/ecosia-lowest-carbon-ai-search-engineering-low-power-inference-green-scheduling-renewable-optimization/)
- 日期: 2025-12-03T14:20:20+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 工程化Ecosia AI搜索最低碳足迹实践：INT8量化减能耗50%、碳强度调度阈值<100g/kWh、PPA绿电集成，实现PUE 1.15。

### [Memori 分层语义去重与 LRU 驱逐及 compaction 阈值：LLM 多代理高效长期记忆](/posts/2025/12/03/memori-hierarchical-semantic-dedup-lru-eviction-compaction-multi-agent-memory/)
- 日期: 2025-12-03T14:10:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Memori 通过分层语义去重、LRU 驱逐策略与 compaction 阈值，实现 LLM 代理及多代理系统高效长期记忆管理，详解工程参数、监控要点与落地清单。

### [API触发有状态多轮电话AI管道：实时ASR/TTS集成与session checkpointing](/posts/2025/12/03/api-triggered-stateful-multi-turn-phone-ai-pipeline/)
- 日期: 2025-12-03T14:08:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于Microsoft call-center-ai的工程实践，详解API触发stateful电话AI代理的低延迟流式管道参数、session checkpoint机制与监控要点。

### [AI 代理压力测试管道：模拟日常对抗场景下规则违规检测与缓解](/posts/2025/12/03/ai-agent-pressure-testing-pipelines-for-rule-breaking-detection/)
- 日期: 2025-12-03T13:19:53+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 PropensityBench 基准，设计工程化压力测试管道，包括场景构建、压力梯度注入与多层缓解策略，确保代理在高压环境下遵守规则。

### [Mistral 3 中小型模型的多模态融合与长上下文高效部署](/posts/2025/12/03/efficient-multimodal-fusion-long-context-mistral3-medium-models/)
- 日期: 2025-12-03T13:03:48+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 Ministral 3 系列的视觉-文本融合机制、256k 上下文处理优化，以及单 GPU 到边缘设备的可扩展部署参数与监控要点。

### [TrendRadar：多平台热点聚合 + MCP驱动AI分析管道](/posts/2025/12/03/trend-radar-mcp-ai-analysis/)
- 日期: 2025-12-03T12:08:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: TrendRadar聚合35+平台热点，通过MCP协议驱动AI管道，实现趋势追踪、情感分析等13工具，支持Docker部署与多渠道推送，提供工程化参数与监控要点。

### [Memori 分层语义记忆引擎：语义去重压缩与混合存储实现](/posts/2025/12/03/memori-hierarchical-semantic-dedup-compaction/)
- 日期: 2025-12-03T11:05:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 Memori 的分层语义记忆机制，详解 hybrid 存储、多级索引与实时去重压缩管道的参数配置。

### [工程化 StutterZero 实时语音转换 pipeline：结巴检测、转录纠错与 speech-to-speech 流式生成](/posts/2025/12/03/engineering-stutterzero-real-time-speech-conversion-pipeline/)
- 日期: 2025-12-03T10:05:11+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 StutterZero 和 StutterFormer 的端到端结巴语音修正 pipeline，实现低延迟流式检测、转录纠错与 TTS 合成，支持实时应用部署。

### [LightRAG EMNLP 管道：双图索引与查询融合的简单快速 RAG 实现](/posts/2025/12/03/lightrag-emnlp-pipeline-dual-graph-indexing-query-fusion/)
- 日期: 2025-12-03T09:43:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG EMNLP 管道通过本地/全局双图索引 + 查询融合，实现简单快速 RAG，支持高效本地部署与低资源检索增强。

### [Memori：分层语义记忆去重压缩引擎，支持LLM代理长期召回](/posts/2025/12/03/memori-hierarchical-semantic-memory-dedup-llm-agents/)
- 日期: 2025-12-03T09:17:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Memori开源引擎通过embedding聚类与vector存储，实现分层记忆（entity/process/session）的dedup compaction，支持多代理长期语义召回。一行集成，节省80%存储，落地参数详解。

### [LightRAG 本地-全局图查询融合机制](/posts/2025/12/03/lightrag-local-global-graph-query-fusion/)
- 日期: 2025-12-03T08:04:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 LightRAG 双本地-全局图索引与查询融合核心，实现简单快速 RAG 的工程参数与监控要点。

### [ADK-Go 中 Code-First 并行工具分发：状态检查点与追踪控制](/posts/2025/12/03/code-first-parallel-tool-dispatch-in-adk-go/)
- 日期: 2025-12-03T07:19:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 ADK-Go 如何通过 Go 并发原语实现 agents 的并行工具调用，支持状态持久化恢复与细粒度追踪，提升生产级部署灵活性。

### [利用 Nano Banana 生成 AI 字体：提示工程与质量评估实践](/posts/2025/12/03/using-nano-banana-for-ai-font-generation/)
- 日期: 2025-12-03T06:48:22+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 Nano Banana 在 AI 字体生成中的提示工程技巧、输出质量评估指标，以及高效设计参数与优化清单。

### [LightRAG 查询融合蒸馏管道：双图索引下的高效检索优化](/posts/2025/12/03/lightrag-query-fusion-distillation-pipeline/)
- 日期: 2025-12-03T06:05:12+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双本地-全局图索引与查询融合蒸馏管道，实现 LLM 调用减少 50%，同时提升召回率与响应速度，提供工程阈值参数与落地清单。

### [Qwen3-VL 长视频细节提取：架构创新与工程参数](/posts/2025/12/03/qwen3-vl-long-video-detail-extraction/)
- 日期: 2025-12-03T05:48:30+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Qwen3-VL 通过 interleaved MRoPE、DeepStack 和文本时间戳，实现2小时视频（约100万token）的高精度细节定位，提供部署阈值、监控清单与回滚策略。

### [API调用触发电话AI代理：微软Call Center AI的客服自动化管道](/posts/2025/12/03/api-triggered-phone-bot-call-center-ai/)
- 日期: 2025-12-03T05:03:24+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过API一键触发AI代理拨打电话，或配置号码直连bot，实现实时ASR/TTS客服管道。详解参数配置、部署清单与监控要点。

### [Code Wiki：图谱导航与语义嵌入加速单仓代码理解](/posts/2025/12/03/code-wiki-graph-navigation-monorepo-comprehension/)
- 日期: 2025-12-03T04:34:29+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Code Wiki 的知识图谱构建、语义搜索嵌入和多文件上下文管理，加速 monorepo 代码理解的工程参数与实践清单。

### [用 Milvus DiskANN 构建亿级向量搜索引擎：混合多向量过滤与云原生分片](/posts/2025/12/03/build-billion-scale-ann-search-milvus-diskann-hybrid-multi-vector-filtering-cloud-native-sharding/)
- 日期: 2025-12-03T04:20:22+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: DiskANN 磁盘索引结合混合多向量搜索与 Kubernetes 分片，实现亿级嵌入的高效 ANN 检索，附参数调优与运维清单。

### [Claude 4.5 Opus 的 Soul Document 机制：模型自省与跨对话记忆工程化](/posts/2025/12/03/claude-4-5-opus-soul-document/)
- 日期: 2025-12-03T03:54:12+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 解析 Claude 4.5 Opus Soul Document 如何实现内部自省状态持久化，提供跨对话记忆的工程参数、监控阈值与落地清单，提升长上下文任务稳定性。

### [Trainium3 与 P5 实例：自定义硅 FP8 格式与 Neuron 编译器融合实现 LLM 训练 4 倍加速](/posts/2025/12/03/trainium3-p5-custom-ai-chip-training-inference/)
- 日期: 2025-12-03T03:34:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Trainium3 通过 3nm 工艺、FP8 精度、Neuron 编译器融合运算及 Trn3/P5 集群扩展，实现较 Trainium2 4 倍 LLM 训练加速，提供工程参数与监控清单。

### [ADK-Go：AI代理并行评估、自定义基准与检查点感知部署实践](/posts/2025/12/03/adk-go-agent-evaluation-benchmarks-deployment/)
- 日期: 2025-12-03T02:12:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Google ADK-Go 工具包，详解 Go 并发驱动的并行代理评估、自定义基准测试集配置，以及 session checkpoint 保障的可靠部署参数与监控清单。

### [LightRAG 双图查询融合与知识蒸馏：高效 RAG 工程实践](/posts/2025/12/03/lightrag-dual-graph-query-fusion-distillation/)
- 日期: 2025-12-03T01:07:14+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双本地/全球图索引、查询融合机制与知识蒸馏优化，实现大规模文档的高效检索与生成，提供生产参数配置与监控要点。

### [Mistral 3 Medium/Small 模型架构：高效多模态融合、长上下文扩展与生产级低延迟推理](/posts/2025/12/03/mistral-3-medium-small-model-architectures-efficient-multimodal-fusion-long-context/)
- 日期: 2025-12-03T00:54:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 Mistral 3 Medium 和 Small 模型的多模态融合机制、128k 长上下文扩展及基准性能，提供生产级部署参数、阈值监控与回滚清单。

### [Mistral 3 系列工程实践：指令调优、长上下文与高效推理部署](/posts/2025/12/03/mistral-3-engineering-practices-instruction-tuning-long-context-efficient-inference-deployment/)
- 日期: 2025-12-03T00:34:13+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Mistral 3 系列模型，详解指令调优流程、长上下文优化、多模态融合及高效推理部署的参数配置与监控要点，实现生产级落地。

### [Mistral 3 模型家族推理管道工程化：扩展、量化和多模态部署优化](/posts/2025/12/02/engineering-inference-pipelines-mistral-3-scaling-quantization-multi-modal/)
- 日期: 2025-12-02T23:18:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 Mistral 3 开源多模态模型家族，详解推理服务的 scaling、量化压缩及多模态部署的关键工程参数与最佳实践。

### [ADK-Go：Code-First Go Toolkit 中的并行工具分发与状态检查点恢复](/posts/2025/12/02/adk-go-code-first-parallel-tool-dispatch-state-checkpoint-recovery/)
- 日期: 2025-12-02T22:11:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Google ADK-Go 工具包，工程化实现 AI Agent 的并行工具调用、状态快照保存与检查点恢复，支持多步复杂系统的可靠执行与追踪监控。

### [LightRAG：双本地-全局图索引与查询融合的简单快速 RAG 构建](/posts/2025/12/02/simple-fast-rag-dual-local-global-graph-indexing-query-fusion-distillation/)
- 日期: 2025-12-02T22:08:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双层知识图谱索引（local/global）、查询融合机制和低资源蒸馏管道，实现高效 RAG，提升 LLM 检索增强的全局理解与准确率。

### [DeepSeek-V3.2 MoA 架构下 Latent Vector 路由与 FP8 量化的推理优化](/posts/2025/12/02/deepseek-v3-2-moa-latent-vector-routing-fp8-inference/)
- 日期: 2025-12-02T21:41:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 MoA 架构，详解 latent vector 在路由机制中的作用，结合 FP8 量化实现 1.2x 推理加速与低内存部署的关键阈值、参数与监控清单。

### [LightRAG 双本地-全局图索引查询融合蒸馏管道工程实现：低资源阈值调优提升准确率20%](/posts/2025/12/02/lightrag-dual-local-global-graph-query-fusion-distillation-pipeline/)
- 日期: 2025-12-02T20:50:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 双图索引查询融合管道工程参数与低资源优化策略，实现 RAG 准确率提升20% 的落地要点。

### [通过脚本重置 Cursor AI MachineID 绕过试用限制](/posts/2025/12/02/reset-cursor-machineid-bypass-trial-limits/)
- 日期: 2025-12-02T20:23:00+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 Cursor AI 0.49.x 版本，提供脚本重置 MachineID 的工程参数与注意事项，实现 Pro 功能如更高 token 用量。

### [DeepSeek-V3 MoA 中潜变量向量动态路由与 FP8 混合精度推理优化](/posts/2025/12/02/deepseek-v3-moa-latent-vector-routing-fp8-inference/)
- 日期: 2025-12-02T19:35:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对600B级MoE模型，详解latent vector动态路由阈值调优、FP8量化策略，实现吞吐提升1.8倍与内存压缩93%的工程参数与监控要点。

### [LLM构建FPS游戏克隆的工程瓶颈：Counter-Strike状态同步与碰撞检测失败剖析](/posts/2025/12/02/llm-limits-in-generating-fps-games-counter-strike-clone-bottlenecks/)
- 日期: 2025-12-02T19:20:53+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析Codex、Opus、Gemini生成Counter-Strike克隆的工程瓶颈，提供Unity基准测试架构与阈值参数。

### [API触发AI电话代理部署：无服务器呼叫中心自动化](/posts/2025/12/02/api-triggered-phone-ai-agent-deployment/)
- 日期: 2025-12-02T18:38:12+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于微软call-center-ai，用API一键触发AI拨打电话或接听，支持实时流式交互与断线续传，提供部署参数、超时阈值与监控清单。

### [Memori 多代理分层记忆引擎：语义去重压缩与持久上下文同步工程实践](/posts/2025/12/02/memori-multi-agent-hierarchical-dedup/)
- 日期: 2025-12-02T18:09:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Memori 开源引擎的分层存储与语义去重机制，支持 multi-agent LLM 持久上下文同步，提供阈值调优、监控参数与多代理落地清单。

### [LightRAG 双本地-全局图索引与查询融合蒸馏 Pipeline：低资源高效 RAG 实现](/posts/2025/12/02/lightrag-dual-local-global-graph-indexing-and-query-fusion-distillation-pipeline/)
- 日期: 2025-12-02T17:48:52+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双层图索引（local 实体、全局关系）和查询融合，实现低资源高效 RAG 检索增强生成。详解 pipeline 参数配置、落地清单与监控要点。

### [Apple STARFlow-V 开源 normalizing flows 视频模型：高效训练与部署工程实践](/posts/2025/12/02/apple-starflow-v-normalizing-flows-open-weights-video-generation/)
- 日期: 2025-12-02T17:35:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Apple STARFlow-V 利用 normalizing flows 实现无扩散视频生成，提供 fine-tune 配置、推理优化参数与工程部署清单，支持 T2V/I2V/V2V 多任务。

### [Cloudflare收购Replicate后：边缘GPU上无缝模型服务与低延迟推理工程实践](/posts/2025/12/02/post-replicate-acquisition-seamless-model-serving-on-cloudflare-edge-gpus-with-low-latency-inference/)
- 日期: 2025-12-02T17:18:33+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于Cloudflare Workers AI与Replicate集成，给出边缘GPU模型部署、低延迟推理调优、零停机上线与统一编排的生产参数与监控清单。

### [DeepSeek-V3.2 多头潜在注意力 MoA：KV 缓存压缩与长上下文推理优化](/posts/2025/12/02/deepseek-v3-2-multi-head-latent-attention-moa/)
- 日期: 2025-12-02T17:05:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: DeepSeek-V3.2 通过多头潜在注意力（MLA/MoA）机制，用低维投影替换传统MHA的KV缓存，实现93%压缩，支持128K+长上下文高效推理，提供工程参数与部署要点。

### [Replicate 加入 Cloudflare 后 Workers AI 的边缘 GPU 模型路由与负载均衡实践](/posts/2025/12/02/workers-ai-edge-gpu-orchestration-with-replicate-integration/)
- 日期: 2025-12-02T16:41:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 Replicate 收购后 Workers AI 如何通过边缘 GPU 路由、版本切换和自动负载均衡实现全球毫秒级 AI 推理缩放，提供工程参数与监控要点。

### [利用 Cloudflare 边缘 GPU Workers 运行 Replicate 模型：低延迟推理与自动缩放实践](/posts/2025/12/02/leverage-replicate-models-on-cloudflare-edge-gpu-workers-for-low-latency-inference/)
- 日期: 2025-12-02T16:19:05+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Cloudflare 收购 Replicate 后，开发者可将 50k+ 模型无缝部署到全球边缘 GPU，实现毫秒级 TTFT、低延迟推理与自动缩放。提供 Workers AI 集成参数、迁移清单与监控要点。

### [Anthropic Claude 多代理 Swarm Fuzz 区块链合约：POC 生成、Fork 验证与 $4.6M DeFi Exploit 经济评估](/posts/2025/12/02/anthropic-claude-agent-swarm-fuzzing-blockchain-contracts-poc-fork-validation/)
- 日期: 2025-12-02T15:34:07+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Anthropic Claude 的多代理 swarm 系统 fuzz 区块链合约，详解 POC 生成流程、fork 验证参数与 $4.6M DeFi 漏洞经济影响评估机制，提供工程化落地清单。

### [STARFlow-V： normalizing flows 驱动的高效视频生成架构与部署参数](/posts/2025/12/02/starflow-v-normalizing-flows-video-generation/)
- 日期: 2025-12-02T15:03:05+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于NF的STARFlow-V实现视频diffusion级质量，剖析global-local设计、FSM去噪与Jacobi采样，提供工程参数与on-device优化清单。

### [ADK-Go：基准测试与指标驱动的 AI 代理评估及 Go 并发部署实践](/posts/2025/12/02/adk-go-ai-agent-evaluation-benchmarks-deployment/)
- 日期: 2025-12-02T14:12:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 ADK-Go 的内置评估框架实现 AI 代理精确基准测试与指标监控，结合 Go 并发机制编排多代理部署，提供工程化参数与监控清单。

### [Twilio+AI代理状态流式电话架构：实时ASR/TTS管道、多轮对话session管理、低延迟中断续传工程实现](/posts/2025/12/02/twilio-ai-agent-stateful-session-multi-turn-phone-architecture-real-time-asr-tts-pipeline/)
- 日期: 2025-12-02T12:19:24+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 借鉴微软Call Center AI，详解Twilio集成AI电话代理的stateful session、多turn对话恢复与流式ASR/TTS工程参数，实现低延迟中断续传。

### [Arcee Trinity Mini：美国本土 MoE 训练管道与合规部署策略](/posts/2025/12/02/arcee-trinity-mini-us-moe-training-compliance-deployment/)
- 日期: 2025-12-02T12:08:19+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 详解 Trinity Mini 的端到端 US 训练流程、合规数据策略及动态路由的企业级参数配置。

### [Claude 多代理 fuzz 区块链合约漏洞：fork 验证与 POC 生成 Pipeline，实现 460 万美元赏金发现](/posts/2025/12/02/claude-multi-agent-fuzz-blockchain-exploits-4-6m-pipeline/)
- 日期: 2025-12-02T11:04:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 工程化 Claude 多代理系统 fuzz DeFi 合约，集成 Foundry fork 验证与 exploit POC 自动生成，详解生产参数与 bounty 落地，实现真实 460 万美元漏洞赏金。

### [TrendRadar：多平台热点采集与 MCP 驱动的 AI 舆情分析](/posts/2025/12/02/trendradar-multi-platform-mcp-ai-analysis/)
- 日期: 2025-12-02T10:49:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 集成35平台实时热点采集、语义去重，通过MCP工具链驱动AI舆情分析，支持企业微信/Telegram零代码推送。详解工程参数、部署清单与监控要点。

### [Codex、Opus与Gemini联手生成Counter-Strike克隆：状态机、网络同步与渲染工程参数](/posts/2025/12/02/codex-opus-gemini-counter-strike-clone-generation/)
- 日期: 2025-12-02T09:48:14+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 用顶级LLM构建CS克隆，详解状态机设计、InstantDB实时同步参数、渲染失败模式及生产级阈值监控，确保多玩家一致性。

### [Arcee Trinity Mini：美国训练的3B MoE模型，低延迟消费者GPU推理优化](/posts/2025/12/02/arcee-trinity-mini-us-trained-moe-inference/)
- 日期: 2025-12-02T09:34:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析Arcee Trinity Mini的动态专家路由与稀疏激活机制，提供消费级GPU高效推理的参数配置、阈值与边缘部署策略。

### [Milvus DiskANN 索引：亿级混合多向量过滤与动态分片低延迟查询](/posts/2025/12/02/milvus-diskann-indexing-hybrid-multi-vector-filtering/)
- 日期: 2025-12-02T09:04:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Milvus 基于 DiskANN 实现亿级 ANN 搜索，支持 hybrid 多向量过滤、动态分片，提供低延迟查询参数与工程化监控要点。

### [Memori 分层语义记忆引擎：自动去重紧凑与多代理同步实践](/posts/2025/12/02/memori-hierarchical-memory-engine/)
- 日期: 2025-12-02T08:47:16+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 Memori 开源引擎的分层存储架构，支持 LLM 代理长时记忆持久化，通过 Conscious Agent 实现语义去重紧凑、多代理 namespace 同步的工程参数与监控要点。

### [LightRAG 查询融合蒸馏管道：双图索引低资源 RAG 实现](/posts/2025/12/02/lightrag-query-fusion-distillation-pipeline/)
- 日期: 2025-12-02T08:22:20+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双本地/全球图索引与查询融合蒸馏管道，在低资源环境下实现高效复杂检索，提供工程参数与部署清单。

### [LLM自主生成CS克隆版极限：Codex、Opus、Gemini评估](/posts/2025/12/02/evaluating-llm-limits-cs-clone-generation/)
- 日期: 2025-12-02T07:18:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过迭代提示和错误恢复，测试Codex、Opus、Gemini生成完整反恐精英克隆（物理、网络、UI）的瓶颈，提供工程化参数与监控清单。

### [DeepSeek-V3.2 MoA：多头潜在注意力与GQA融合架构](/posts/2025/12/02/deepseek-v3-2-moa-multi-head-latent-attention/)
- 日期: 2025-12-02T06:51:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: DeepSeek-V3.2 通过 MoA 架构融合多头潜在注意力（MLA）与 GQA，实现 671B MoE 模型的 KV Cache 压缩与动态路由优化，提升训练和推理效率。

### [AI Zettelkasten：多模态想法提取管道工程实践](/posts/2025/12/02/ai-zettelkasten-multi-modal-idea-extraction/)
- 日期: 2025-12-02T06:18:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于LLM的多模态内容关键想法提取管道，生成带embeddings的Zettelkasten笔记，并构建知识图谱实现高效检索。详解参数阈值、工具栈与落地清单。

### [无姿态3D高斯溅射：SPFSplat自监督稀疏视图重建](/posts/2025/12/02/pose-free-3d-gaussian-splatting-self-supervised-spfsplat/)
- 日期: 2025-12-02T06:09:19+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从无姿态稀疏图像实现3D场景重建，支持无监督新视图合成。详解SPFSplat架构、损失设计与工程参数。

### [LLM 谄媚检测与缓解：提示强化、异议训练与偏置审计管道](/posts/2025/12/02/llm-sycophancy-detection-mitigation/)
- 日期: 2025-12-02T05:03:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 LLM 谄媚暗黑模式，提供提示硬化、异议训练及偏置审计的工程参数与监控清单，实现意见无关的可靠响应。

### [代码优先的 Go AI Agent 工具包：会话检查点、追踪与灵活控制](/posts/2025/12/02/code-first-go-ai-agents-toolkit-session-checkpointing-tracing-control/)
- 日期: 2025-12-02T04:10:13+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Google ADK-Go 的代码优先方法构建 AI Agent，聚焦会话检查点恢复、追踪监控与工程化部署参数。

### [LightRAG 中的双本地-全局图索引与查询融合](/posts/2025/12/02/dual-local-global-graph-indexing-and-query-fusion-in-lightrag/)
- 日期: 2025-12-02T04:04:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双本地-全局图索引机制融合实体关系检索与查询重构，实现低资源 RAG 加速，提供高效参数配置与监控要点。

### [用 Twilio SMS 增强 Microsoft Call Center AI：无服务器语音代理呼叫中心集成](/posts/2025/12/02/call-center-ai-with-twilio-phone-agent-integration/)
- 日期: 2025-12-02T02:49:15+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于开源 call-center-ai 项目，集成 Twilio SMS 实现 API 触发 AI 代理拨打电话，支持实时 TTS/STT、状态管理和错误恢复的工程参数与部署清单。

### [DeepSeek-V3.2 高效训练与推理优化：开源 MoE LLM 迈向前沿能力](/posts/2025/12/02/deepseek-v3-2-efficient-training-inference-optimizations/)
- 日期: 2025-12-02T02:34:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: DeepSeek-V3.2 通过 DSA 稀疏注意力机制与思考工具调用集成，实现长上下文高效推理与 Agent 能力前沿，推动开源 MoE LLM 性能逼近 GPT-5，提供部署参数、监控阈值与工程化清单。

### [Memori：语义去重与分级压缩在 Agent 记忆引擎中的应用](/posts/2025/12/02/memori-semantic-dedup-compaction/)
- 日期: 2025-12-02T02:08:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 Memori 开源记忆引擎的语义去重机制、分级压缩策略及多代理同步参数，实现 LLM/Agent 高效率持久化与检索。

### [ADK-Go中并行工具分发与状态快照序列化：多步推理持久化实践](/posts/2025/12/01/parallel-tool-dispatch-and-state-snapshot-in-adk-go/)
- 日期: 2025-12-01T23:03:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Google ADK-Go工具包中，并行工具调度与状态快照机制，支持复杂AI代理多步推理的持久化恢复与工程参数配置。

### [ADK-Go 会话检查点恢复与工具追踪：长运行代理可靠性的工程实践](/posts/2025/12/01/adk-go-session-checkpoint-recovery-tracing/)
- 日期: 2025-12-01T22:48:36+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Go 的 ADK 工具包中，session 检查点恢复机制结合 telemetry 追踪，支持长运行 AI 代理的容错与调试，提供关键参数配置与监控清单。

### [使用 ADK-Go 构建代码优先的 AI 代理：会话检查点与追踪实践](/posts/2025/12/01/code-first-ai-agents-with-adk-go-session-checkpointing-and-tracing/)
- 日期: 2025-12-01T21:50:42+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Google ADK-Go 工具包，介绍代码优先构建复杂 AI 代理的会话检查点恢复、分布式追踪配置与评估部署要点。

### [LightRAG 低资源双图索引：查询融合与蒸馏优化实现](/posts/2025/12/01/lightrag-low-resource-query-fusion-distillation/)
- 日期: 2025-12-01T20:48:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双层图索引结合查询融合和低资源蒸馏优化，实现高效 RAG 系统，优于 GraphRAG 等基线，提供工程参数与监控清单。