# 分类：ai-systems

> 该分类下的文章按时间倒序排列，便于按主题继续深挖。

## 页面摘要
- 路径: /categories/ai-systems/page/45/
- 当前页: 45 / 75
- 文章总数: 5960
- 当前页文章数: 80

## 快速导航
- [首页](/)
- [分类索引](/categories/)
- [归档索引](/archive/)

## 本页文章
### [Engineering Emergent Collaboration in VERL via Reward Sharing](/posts/2025/11/19/engineering-emergent-collaboration-in-verl-via-reward-sharing/)
- 日期: 2025-11-19T05:16:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: VERL的多代理RL框架通过奖励共享策略实现LLM任务分解中的涌现协作，提升离线对齐效果，提供工程化参数与监控要点。

### [使用 Tokenflood 实现 LLM 并发 Token 洪水负载测试：基准吞吐量与分布式扩展](/posts/2025/11/19/using-tokenflood-for-llm-concurrent-token-flooding-load-testing-throughput-benchmarking-distributed-scaling/)
- 日期: 2025-11-19T05:01:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 介绍 Tokenflood 工具在 LLM 负载模拟中的应用，聚焦并发 token 洪水测试、率限制处理及分布式多端点扩展，实现高效的推理吞吐量基准。

### [Cursor AI 机器 ID 重置：绕过试用限制实现持久 Pro 访问](/posts/2025/11/19/cursor-ai-machine-id-bypass/)
- 日期: 2025-11-19T04:01:48+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过本地配置覆盖和代理仿真，重置 Cursor AI 机器 ID，规避试用限制，实现无限 Pro 功能访问的工程实践。

### [Strix Halo iGPU 内存优化：针对 AI 推理的 L3 分区与带宽分配](/posts/2025/11/19/strix-halo-igpu-memory-optimization-for-ai-inference/)
- 日期: 2025-11-19T03:46:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 Strix Halo APU 中，通过 L3 缓存分区和内存带宽分配优化 iGPU 的 AI 推理性能，实现矩阵乘法 4 倍加速的关键策略与参数。

### [LLM 长链中错误传播的 Markov 建模与回滚阈值优化](/posts/2025/11/19/error-propagation-modeling-and-rollback-threshold-optimization-in-long-llm-chains/)
- 日期: 2025-11-19T03:16:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 Markov 过程模拟百万步 LLM 链的错误累积，推导最小计算开销下的回滚阈值，确保长时域任务失败率低于 0.01%。

### [RowboatX：开源 Claude 代码解释器扩展工程化日常自动化](/posts/2025/11/19/rowboatx-open-source-claude-code-automations/)
- 日期: 2025-11-19T03:01:29+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 RowboatX 如何通过开源扩展 Claude Code Interpreter，实现任务脚本、API 集成与持久执行管道的无缝日常自动化工程化参数。

### [代码优先的 Go 工具包：构建 AI 代理的模块化评估与动态模型切换](/posts/2025/11/19/code-first-go-toolkit-for-ai-agents/)
- 日期: 2025-11-19T02:46:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 ADK-Go 的代码优先方法，探讨模块化评估管道、动态模型切换以及多代理系统的部署编排，提供工程化参数和最佳实践。

### [LiteLLM 代理中 Rust 集成挑战：异步开销、借用检查与内存模式优化](/posts/2025/11/19/litellm-rust-optimization-pitfalls/)
- 日期: 2025-11-19T02:31:48+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 分析 Rust 在 LiteLLM 代理中的集成陷阱，聚焦异步运行时、借用规则和内存行为，提供工程化参数与教训。

### [LightRAG 双图索引结构：实体关系图与块图的 RAG 实现](/posts/2025/11/19/lightrag-dual-graph-indexing/)
- 日期: 2025-11-19T02:02:03+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双图结构实现高效 RAG：实体关系图处理语义链接，块图支持递归检索，低延迟查询无需重度嵌入，提供构建和集成指南。

### [在 Google Antigravity 中实现 AI 驱动的代码合成与自动重构](/posts/2025/11/19/implementing-ai-driven-code-synthesis-and-refactoring-in-google-antigravity/)
- 日期: 2025-11-19T01:16:36+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Google Antigravity 的 AI 代理实现代码合成和自动重构，支持无缝、无错误的软件迭代周期，提供工程参数与监控要点。

### [LLM 长链任务零错误执行：验证层与回滚机制实现](/posts/2025/11/19/implementing-verification-layers-and-rollback-in-llm-chains-for-zero-error-execution/)
- 日期: 2025-11-19T01:01:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在LLM百万步推理链中，通过验证层检测错误并回滚机制恢复，实现零错误执行的工程实践与参数配置。

### [LiteLLM 代理的 Rust 实现基准测试：提升多 LLM 路由吞吐量](/posts/2025/11/19/benchmark-rust-litellm-proxy-multi-llm-routing-throughput/)
- 日期: 2025-11-19T00:46:47+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 Rust 加速 LiteLLM 代理，比较异步处理和内存效率与 Python 基线，实现 2-20x 性能提升。提供工程化参数和监控要点。

### [使用 n8n 工作流工程化低代码 AI 自动化：LLM 链式与错误处理](/posts/2025/11/19/engineering-low-code-ai-automation-n8n-workflows-llm-chaining-error-handling/)
- 日期: 2025-11-19T00:31:52+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 n8n 构建生产级 AI 自动化管道，聚焦 LLM 链式调用、错误处理机制及有状态集成的工程实践与参数配置。

### [使用 Gemini 3 工具调用 API 构建代理工作流](/posts/2025/11/19/engineering-agentic-workflows-with-gemini-3-tool-calling/)
- 日期: 2025-11-19T00:16:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Gemini 3 的增强推理和工具调用能力，工程化代理工作流，实现自主多步任务执行和决策，提供 API 配置参数与集成清单。

### [使用 Milvus 构建可扩展向量数据库：亿级规模 ANN 搜索的混合索引](/posts/2025/11/19/building-scalable-vector-db-milvus-hybrid-indexing-billion-scale-ann/)
- 日期: 2025-11-19T00:01:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Milvus 云原生向量数据库的混合索引策略，实现亿级规模近似最近邻搜索，并优化数据摄入与查询吞吐量。

### [在 Google AI Studio 中集成 Gemini 3 Pro 实时预览](/posts/2025/11/18/integrating-gemini-3-pro-live-previews-in-google-ai-studio/)
- 日期: 2025-11-18T23:47:12+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向开发者，在 AI Studio 中利用 Gemini 3 Pro 进行实时多模态生成实验，聚焦流式输出和长上下文处理。

### [在自定义评估管道中复现Gemini 3 Pro模型卡基准：多模态安全与长上下文检索](/posts/2025/11/18/replicate-gemini-3-pro-model-card-benchmarks-in-custom-eval-pipelines-for-multimodal-safety-and-long-context-retrieval/)
- 日期: 2025-11-18T23:31:52+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何复现Gemini 3 Pro的基准测试，聚焦多模态安全和长上下文能力，并将稀疏MoE指标集成到CI/CD流程中。

### [构建 TrendRadar：多平台 AI 新闻聚合器与 MCP 分析系统](/posts/2025/11/18/building-trendradar-multi-platform-ai-news-aggregator-with-mcp-analysis/)
- 日期: 2025-11-18T23:16:30+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: TrendRadar 是一个 AI 驱动的新闻聚合工具，监控 35 个平台热点，支持 MCP 协议的智能分析、Docker 部署和多渠道通知，实现高效趋势监测。

### [工程化 Gemini 3 Pro 的多模态融合层：高效视觉-语言推理与稀疏 MoE 及 1M 令牌长上下文处理](/posts/2025/11/18/engineering-gemini-3-pro-multimodal-fusion-layers-sparse-moe-1m-token-long-context-handling/)
- 日期: 2025-11-18T21:16:36+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 Gemini 3 Pro 的多模态融合层工程化，给出稀疏 MoE 实现与长上下文处理的实用参数与优化策略。

### [将 Gemini Pro 安全护栏集成到 LLM 服务栈中](/posts/2025/11/18/integrate-gemini-pro-safety-guardrails-llm-stacks/)
- 日期: 2025-11-18T20:47:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向生产级 LLM 服务，介绍 Gemini Pro 的安全分类器与红队防御集成策略，实现对齐、偏见缓解，提供参数配置与监控要点。

### [Continuous Claude 执行循环中集成外部工具调用：API 和数据库交互的持久状态管理](/posts/2025/11/18/integrate-external-tool-calling-continuous-claude/)
- 日期: 2025-11-18T19:46:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 Continuous Claude 的框架下集成工具调用功能，支持外部 API 和数据库操作，并维护持久状态以提升代理的连续性和可靠性。

### [Orchestrating Multi-Agent AI Workflows in Go with ADK-Go](/posts/2025/11/18/orchestrating-multi-agent-ai-workflows-in-go-with-adk-go/)
- 日期: 2025-11-18T18:07:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探索 ADK-Go 如何通过代理层次、工作流代理和交互机制实现代码优先的多代理编排，支持任务分解和动态路由，提升可扩展 AI 系统开发。

### [Continuous Claude 错误恢复与重试机制](/posts/2025/11/18/continuous-claude-error-recovery-retry/)
- 日期: 2025-11-18T17:31:52+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 Continuous Claude 的循环执行中，设计容错重试策略，分类 API 失败类型，确保会话连续性和工程化落地参数。

### [LightRAG 双图 RAG 的可扩展图索引与多跳优化：递归检索、关系修剪与动态阈值调优](/posts/2025/11/18/optimizing-lightrags-dual-graph-rag-scalable-indexing-multi-hop-retrieval-with-pruning-and-threshold-tuning/)
- 日期: 2025-11-18T16:31:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 LightRAG 的双图 RAG 系统，优化可扩展索引、多跳检索、关系修剪与阈值调优，实现低延迟 QA，提升生产效率。

### [Memori中实现关键事件提取与层级摘要的对话历史压缩](/posts/2025/11/18/implementing-key-event-extraction-and-hierarchical-summarization-for-conversation-history-compression-in-memori/)
- 日期: 2025-11-18T16:06:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨在Memori框架下，通过关键事件提取和层级摘要机制压缩长对话历史，实现高效的多轮AI代理交互上下文保留。提供工程参数、阈值设置与监控策略。

### [使用 Call Center AI 与 Twilio 集成 AI 代理实现 API 触发出站电话呼叫：低延迟 STT/TTS 管道与持久状态管理](/posts/2025/11/18/integrate-ai-agents-twilio-call-center-ai-api-outbound-calls-low-latency-stt-tts-persistent-state/)
- 日期: 2025-11-18T16:01:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Microsoft Call Center AI 工具包，探讨与 Twilio 集成实现 API 驱动出站呼叫，支持实时 STT/TTS 处理和状态持久化，提升呼叫中心场景下的 AI 代理效率。

### [在 adk-go 中实现运行时模型路由优化：平衡成本、延迟与准确性](/posts/2025/11/18/implement-runtime-heuristics-adk-go-dynamic-model-selection/)
- 日期: 2025-11-18T15:47:03+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨在 adk-go 框架下，通过运行时启发式动态选择模型，实现跨 OpenAI 和 Anthropic 等提供商的成本、延迟和任务准确性平衡，提供工程参数和实现指南。

### [使用 Azure Cosmos DB 设计 AI 电话代理的持久状态机：对话历史与上下文管理](/posts/2025/11/18/ai-phone-agents-persistent-state-machines-cosmos-db/)
- 日期: 2025-11-18T14:47:22+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何利用 Azure Cosmos DB 为 AI 电话代理构建持久状态机，实现低延迟的对话历史、用户意图和跨会话上下文跟踪，提升呼叫中心效率。

### [Memori 中情节记忆检索机制设计：时序索引与相关性评分](/posts/2025/11/18/designing-episodic-memory-retrieval-in-memori-temporal-indexing-and-relevance-scoring/)
- 日期: 2025-11-18T14:01:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨在 Memori 框架下设计情节记忆检索系统，利用时序索引和相关性评分机制，以在多代理 LLM 交互中保留长期上下文，提供工程化参数和实现要点。

### [Memori 中实现混合向量-图存储：用于持久多代理 LLM 记忆](/posts/2025/11/18/implementing-hybrid-vector-graph-storage-in-memori/)
- 日期: 2025-11-18T13:40:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Memori 中混合向量和图结构的存储实现，支持语义搜索与关系查询，实现跨会话的 episodic recall。提供工程参数与监控要点。

### [ADK-Go 工具包与 OpenAI/Anthropic API 集成：实现混合 AI 代理的动态模型切换](/posts/2025/11/18/integrate-adk-go-with-openai-and-anthropic-apis-for-dynamic-model-switching-in-hybrid-ai-agents/)
- 日期: 2025-11-18T12:17:00+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 ADK-Go 工具包集成 OpenAI 和 Anthropic API，实现混合 AI 代理中的动态模型切换，支持任务自适应推理，避免供应商锁定，提供工程化参数和最佳实践。

### [LightRAG 中关系修剪阈值的动态选择](/posts/2025/11/18/lightrag-relation-pruning-threshold-selection/)
- 日期: 2025-11-18T12:06:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 LightRAG 双图 RAG 系统中，探讨关系修剪阈值的动态选择策略，以平衡多跳查询的召回-精确度，并在内存约束下优化性能。

### [Memori中多代理实时内存同步协议与冲突解决工程实践](/posts/2025/11/18/multi-agent-memory-synchronization-in-memori/)
- 日期: 2025-11-18T11:31:30+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向多代理LLM协作，给出Memori内存同步协议、冲突解决策略及工程参数配置。

### [基于提示的指纹识别：检测 Google Gemini 未经授权使用私人用户数据](/posts/2025/11/18/prompt-based-fingerprinting-detect-google-gemini-unauthorized-user-data/)
- 日期: 2025-11-18T11:16:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 工程化提示指纹和审计方法，帮助检测 Gemini AI 是否未经许可使用用户私人数据，提供落地参数与监控策略。

### [在 WeatherNext 2 中实现扩散模型的集成天气预报：融合卫星图像与数值数据的高分辨率概率预测](/posts/2025/11/18/implement-diffusion-models-for-ensemble-weather-forecasting-in-weathernext/)
- 日期: 2025-11-18T10:06:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何在 WeatherNext 2 中使用扩散模型进行集成天气预报，融合卫星图像和数值数据，实现高分辨率概率预测并量化不确定性。提供工程化参数、融合策略和不确定性量化方法，帮助开发者落地多模态 AI 天气系统。

### [Memori 中混合向量-图查询优化：多代理内存的高效多跳检索](/posts/2025/11/18/hybrid-vector-graph-query-optimization-in-memori/)
- 日期: 2025-11-18T10:06:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨在 Memori 框架中集成混合向量-图索引，以实现分布式 LLM 代理内存的多跳查询和相似性搜索优化，提升检索效率和准确性。

### [LightRAG 双图中多跳查询的关联剪枝优化：降低延迟并保持检索准确性](/posts/2025/11/18/lightrag-multi-hop-relation-pruning/)
- 日期: 2025-11-18T10:01:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 LightRAG 的双图结构中，针对多跳查询引入关联剪枝策略，优化遍历过程以减少延迟，同时确保无嵌入 RAG 的检索准确性。

### [使用 Azure 服务构建 API 驱动的 AI 电话代理外呼系统：实时 STT-LLM-TTS 管道与呼叫状态管理](/posts/2025/11/18/build-api-driven-outbound-phone-calls-ai-agents-azure/)
- 日期: 2025-11-18T08:46:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Microsoft Call Center AI 项目，通过 Azure 服务实现 AI 代理的 API 驱动外呼电话，集成实时 STT-LLM-TTS 管道，并管理呼叫状态以支持可扩展语音自动化。

### [Windows 11 后台 AI 代理的文件夹访问与沙盒隔离工程实践](/posts/2025/11/18/windows-11-background-ai-agent-folder-access-sandboxing/)
- 日期: 2025-11-18T08:16:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向持久后台 AI 代理，提供 scoped 文件系统访问的工程参数、沙盒策略与隐私监控要点。

### [LightRAG 中无嵌入双图 RAG：实体关系链接与递归查询实现](/posts/2025/11/18/embedding-free-dual-graph-rag-in-lightrag/)
- 日期: 2025-11-18T08:06:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于实体-关系链接的无嵌入双图 RAG，实现快速可扩展检索，通过递归查询和零样本效率提升性能。

### [Continuous Claude 中的持久化会话管理：维护对话状态与中断恢复](/posts/2025/11/18/persistent-session-management-in-continuous-claude/)
- 日期: 2025-11-18T06:46:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 Continuous Claude 的循环 AI 代码执行，提供持久化会话处理工程实践，确保对话状态维护与中断恢复。

### [Grok 4.1 多模态推理管道的缩放：高效 KV 缓存与动态批处理](/posts/2025/11/18/scaling-inference-pipelines-for-grok-4-1-multimodal-processing/)
- 日期: 2025-11-18T06:31:27+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 Grok 4.1 的多模态处理，探讨 1M+ token 上下文下的推理管道缩放策略，重点优化 KV 缓存与动态批处理以支持实时应用。

### [基于语义嵌入的新闻聚类与去重：TrendRadar 的趋势检测优化](/posts/2025/11/18/ai-similarity-clustering-deduplication/)
- 日期: 2025-11-18T06:16:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 TrendRadar 中使用语义嵌入实现新闻聚类和去重的工程实践，通过阈值调优减少噪音，提升多平台趋势监测效率。

### [VERL中多代理RL工作流的编排：基于LLM的任务分解、奖励共享与复杂环境中的 emergent 协作](/posts/2025/11/18/orchestrating-multi-agent-rl-workflows-in-verl-llm-task-decomposition-reward-sharing-emergent-collaboration/)
- 日期: 2025-11-18T06:06:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用VERL框架编排多代理强化学习工作流，支持LLM驱动的任务分解、奖励共享机制，实现复杂环境下的 emergent 协作行为，提供工程参数与监控要点。

### [Engineering Persistent Memory Storage and Query Optimization in Memori for Multi-Agent LLM Interactions](/posts/2025/11/18/engineering-persistent-memory-storage-and-query-optimization-in-memori-for-multi-agent-llm-interactions/)
- 日期: 2025-11-18T06:01:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文聚焦 Memori 框架的 episodic memory 持久存储工程与查询优化策略，支持可扩展多代理系统实现低延迟检索，提升 LLM 协作效率。

### [Engineering Zero-Downtime Canary and Blue-Green Deployments for Replicate on Cloudflare](/posts/2025/11/18/engineering-zero-downtime-canary-and-blue-green-deployments-for-replicate-on-cloudflare/)
- 日期: 2025-11-18T05:31:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Cloudflare 边缘基础设施，实现 Replicate 模型更新的金丝雀路由和蓝绿部署策略，提供工程参数、监控要点和回滚机制，确保无缝更新。

### [Continuous Claude 连续循环代码执行工具：迭代开发与状态任务自动化](/posts/2025/11/18/continuous-claude-loop-code-execution/)
- 日期: 2025-11-18T03:46:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 介绍 Continuous Claude 工具，用于在 Claude AI 代码解释器中实现连续循环执行，支持迭代开发、错误处理和无手动重启的状态任务。详述安装、配置参数及 GitHub 集成要点。

### [使用扩散模型工程化 WeatherNext 的概率预报](/posts/2025/11/18/engineering-weathernext-diffusion-ensemble-forecasts/)
- 日期: 2025-11-18T03:16:43+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: WeatherNext 作为 GraphCast 继任者，利用扩散模型实现 0.25° 分辨率集合预报，并集成自回归预测支持 15 天严重天气警报的工程实践。

### [使用 ADK-Go 在 Go 中编排多代理 AI 系统：代码优先协调、评估管道与可扩展部署模式](/posts/2025/11/18/orchestrating-multi-agent-ai-systems-in-go-with-adk-go/)
- 日期: 2025-11-18T02:46:30+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 ADK-Go 在 Go 语言中实现多代理 AI 系统的协调，聚焦代码驱动的交互协议、评估流程以及 scalable 部署策略，提供工程化参数和监控要点。

### [LightRAG：使用双图实现无嵌入 RAG 效率优化](/posts/2025/11/18/lightrag-embedding-free-rag-efficiency/)
- 日期: 2025-11-18T02:16:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向资源受限 LLM 管道，工程化无嵌入 RAG 系统，利用双图进行实体提取和递归检索，提升速度与简单性。

### [使用 ADK-Go 开发 AI 代理评估管道：多步推理、工具集成与错误恢复基准测试](/posts/2025/11/18/developing-evaluation-pipelines-in-adk-go-for-ai-agent-benchmarking/)
- 日期: 2025-11-18T01:31:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 ADK-Go 构建代码优先的评估框架，针对 AI 代理的多步推理、工具集成和错误恢复进行基准测试，提供实用参数和监控策略。

### [基于 MCP 的 AI 多平台新闻监控：趋势分析与 Docker 实时通知集成](/posts/2025/11/18/integrate-mcp-ai-multi-platform-news-monitoring-docker-deployment/)
- 日期: 2025-11-18T00:31:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: TrendRadar 项目利用 MCP 协议实现 AI 驱动的多平台新闻聚合与分析，支持趋势追踪、情感检测，并通过 Docker 部署实现企业级实时推送通知，助力高效舆情监控。

### [Replicate 与 Cloudflare 集成：边缘计算驱动的无服务器 AI 全球推理](/posts/2025/11/17/merging-replicate-with-cloudflare-for-edge-powered-serverless-ai-inference/)
- 日期: 2025-11-17T23:46:52+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探索 Cloudflare 收购 Replicate 后，如何利用边缘计算实现低延迟 AI 模型部署，提供无基础设施管理的全球推理解决方案。

### [通过 Twilio API 实现 LLM 代理的外呼电话集成：实时语音处理与呼叫状态管理](/posts/2025/11/17/outbound-phone-api-integration-with-llm-agents-via-twilio/)
- 日期: 2025-11-17T23:31:57+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 LLM 代理的外呼电话集成，提供 Twilio API 触发、实时语音合成与 STT/LLM 处理，以及呼叫状态管理的工程化参数与监控要点。

### [Milvus GPU 加速 ANN 搜索：CUDA 内核集成与 HNSW-IVF 混合索引优化](/posts/2025/11/17/milvus-gpu-accelerated-ann-search-cuda-hybrid-hnsw-ivf/)
- 日期: 2025-11-17T23:02:14+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向亿级向量规模，集成 Milvus GPU 加速与 CUDA 内核，实现亚毫秒 ANN 查询，使用 HNSW-IVF 混合索引平衡召回与速度。

### [TrendRadar 的 Docker 通知管道工程化：多渠道即时推送与 AI 分析](/posts/2025/11/17/engineering-docker-notification-pipelines-for-trendradar/)
- 日期: 2025-11-17T20:31:47+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 Docker 部署 TrendRadar，实现 35 平台热点聚合、AI 趋势与情感分析，以及 WeCom、Flybook 等多渠道通知的工程化设置，1 分钟内完成快速上线。

### [LightRAG 无嵌入双图零-shot 实体提取与递归检索集成](/posts/2025/11/17/lightrag-zero-shot-graph-retrieval/)
- 日期: 2025-11-17T20:06:20+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: LightRAG 通过双图结构实现零-shot 实体提取与递归检索，支持 LLM 管道中高效 RAG，无需传统向量搜索。

### [LightRAG 中分层实体关系图的实现：多跳查询解析与递归检索](/posts/2025/11/17/implement-hierarchical-entity-relation-graphs-in-lightrag/)
- 日期: 2025-11-17T19:17:11+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 LightRAG 框架中引入分层实体关系图，支持多跳查询的递归检索，实现比平面图低 30% 的延迟。详述工程参数、阈值设置与监控策略。

### [使用 LightRAG 构建无嵌入式图 RAG 管道：双实体关系图的递归检索](/posts/2025/11/17/embedding-free-graph-rag-with-lightrag/)
- 日期: 2025-11-17T18:06:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 LightRAG 的双实体-关系图实现无嵌入 RAG 管道，支持递归检索和 LLM 增强，在低资源环境中比传统向量搜索快 2 倍。

### [Heretic 表示工程的多模型 SSE 去审查集成：断线续传与动态模型切换](/posts/2025/11/17/heretic-multi-model-sse-uncensoring-resumption-switching/)
- 日期: 2025-11-17T18:01:27+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Heretic 的自动去审查技术，在多模型 LLM 管道中通过 SSE 实现容错流式输出，支持断线续传和动态模型切换的生产级部署。

### [工程化低延迟 STT 和 TTS 管道：为 LLM 电话代理集成 Twilio 处理实时对话中的口音和噪声](/posts/2025/11/17/engineering-low-latency-stt-tts-pipelines-for-llm-phone-agents-with-twilio/)
- 日期: 2025-11-17T17:16:36+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文探讨为 LLM 电话代理构建低延迟 STT 和 TTS 管道的工程实践，包括 Twilio 双向音频流集成、错误校正机制，以及实时处理口音和噪声的优化策略。

### [使用 Z3 Python API 建模硬件电路为 SAT 问题：RTL 验证](/posts/2025/11/17/z3-python-hardware-sat-rtl-verification/)
- 日期: 2025-11-17T17:01:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 RTL 设计，使用 Z3 Python API 将电路建模为 SAT 问题，实现属性检查和 bug 狩猎，代码简洁在 50 行内。

### [LightRAG 中的双层图构建：实体提取与关系图工程化](/posts/2025/11/17/dual-graph-construction-in-lightrag/)
- 日期: 2025-11-17T16:31:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从非结构化文本中工程化双层实体提取与关系图构建，实现 LightRAG 的高效可扩展检索增强生成，避免繁重索引开销。

### [Heretic 运行时消融与 SSE 集成：多模型 LLM 流式管道低延迟去审查](/posts/2025/11/17/integrate-heretic-runtime-abliteration-sse-uncensoring-multi-model-streaming/)
- 日期: 2025-11-17T16:16:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向多模型流式输出，给出 Heretic 消融与 SSE 连接管理的工程化参数与监控要点。

### [Memori 剧集内存存储中的语义相似性聚类与去重实现](/posts/2025/11/17/implement-semantic-similarity-clustering-and-deduplication-in-memori-storage/)
- 日期: 2025-11-17T16:01:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 Memori 的 episodic memory store 中，使用向量嵌入实现语义相似性聚类与去重，优化多代理 LLM 交互的存储与检索效率，提供阈值参数和落地清单。

### [Z3 Python API 增量 SMT 求解在动态约束环境中的应用：实时传播与回溯策略](/posts/2025/11/17/incremental-smt-solving-with-z3-python-api-for-dynamic-constraints-in-ai-planning/)
- 日期: 2025-11-17T15:31:36+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Z3 的增量求解功能，在动态环境中实现实时约束传播与高效回溯，适用于 AI 规划等场景，提供工程化参数与最佳实践。

### [Heretic 中低延迟运行时电路消融：用于流式 LLM 响应的逐 token 去审查](/posts/2025/11/17/engineering-low-latency-runtime-abliteration-in-heretic-for-streaming-llm-uncensoring/)
- 日期: 2025-11-17T13:46:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨在 Heretic 中实现低延迟运行时 abliteration，用于 token-by-token 去审查流式 LLM 响应，优化补丁应用以避免完整重计算。

### [使用 Go 的 ADK 工具包构建复杂 AI 代理：工具集成、状态管理和评估框架](/posts/2025/11/17/building-ai-agents-with-adk-go-code-first/)
- 日期: 2025-11-17T13:17:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探索使用 ADK-Go 代码优先构建灵活 AI 代理，集成工具、管理会话状态，并通过评估框架确保可靠开发。提供工程参数和监控要点。

### [使用 ADK-Go 部署代码优先 AI 代理：容器编排、状态持久化和自定义评估框架](/posts/2025/11/17/deploy-code-first-ai-agents-adk-go-container-orchestration/)
- 日期: 2025-11-17T13:01:47+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文探讨如何使用 ADK-Go 工具包部署 code-first AI 代理，重点介绍容器化编排、会话状态持久化以及自定义评估框架，实现可扩展且可重现的代理基准测试。

### [VERL 中 PPO 的 KL 散度正则化：稳定 LLM 对齐训练](/posts/2025/11/17/ppo-kl-regularization-in-verl-for-stable-llm-alignment/)
- 日期: 2025-11-17T12:46:29+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 VERL 的 PPO 框架下集成 KL 散度正则化，防止 offline RLHF 中的模式崩溃，优化奖励-策略散度，实现稳定 LLM 对齐。

### [Heretic 中电路发现与针对性消融：实现多轮 LLM 对话的无审查响应](/posts/2025/11/17/heretic-circuit-abliteration-multi-turn-dialogues/)
- 日期: 2025-11-17T12:31:52+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Heretic 工具，通过电路发现和针对性 abliteration，在多轮 LLM 对话中维持无审查响应，避免重复干预，提供工程参数和监控要点。

### [LightRAG 中实体-关系图的剪枝算法：优化检索延迟与准确性平衡](/posts/2025/11/17/entity-relation-graph-pruning-in-lightrag/)
- 日期: 2025-11-17T12:16:43+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 LightRAG 的实体-关系图，设计剪枝算法消除低相关性边，减少 RAG 检索延迟，同时维持准确性，提供工程参数和监控要点。

### [使用 ADK-Go 工具包通过容器编排部署代码优先 AI 代理](/posts/2025/11/17/deploying-code-first-ai-agents-with-adk-go-container-orchestration/)
- 日期: 2025-11-17T12:06:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 ADK-Go 在容器环境中部署 AI 代理，实现可扩展的生产级推理、监控与自动缩放的工程实践。

### [集成 Heretic 实现 LLM 管道中的运行时选择性去审查](/posts/2025/11/17/integrate-heretic-runtime-selective-uncensoring-pipelines/)
- 日期: 2025-11-17T11:46:24+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Heretic 在 LLM 管道中进行选择性运行时去审查，结合表示工程技术，并设置后备防护栏以确保生产环境的安全部署。

### [Designing Episodic Memory Retrieval in Memori for Multi-Agent LLMs](/posts/2025/11/17/designing-episodic-memory-retrieval-in-memori-for-multi-agent-llms/)
- 日期: 2025-11-17T11:16:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 Memori 框架下设计 episodic memory 模块，用于存储和检索多代理系统中的对话事件，实现高效的上下文感知响应，减少历史加载开销。

### [使用OCR和RAG curation 中国K-12教育语料库支持LLM微调](/posts/2025/11/17/curate-chinese-k12-educational-corpus-ocr-rag-llm/)
- 日期: 2025-11-17T11:01:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于开源中国教科书资源，通过OCR提取、元数据标注构建结构化语料库，并集成RAG系统，用于教育AI中的多语言LLM微调与知识检索。

### [在 Memori 中构建分层知识图谱：多代理 LLM 系统的可扩展事实检索与上下文融合](/posts/2025/11/17/hierarchical-knowledge-graphs-in-memori-for-multi-agent-llms/)
- 日期: 2025-11-17T10:17:03+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何利用 Memori 的关系映射功能构建分层知识图谱，实现多代理系统中高效的事实检索和语义深度优化，提供工程参数与实践指南。

### [Custom Reward Shaping in VERL for RLHF Alignment](/posts/2025/11/17/custom-reward-shaping-in-verl-for-rlhf/)
- 日期: 2025-11-17T10:06:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 VERL 中自定义奖励塑造的设计与集成，针对人类偏好对齐的安全约束和多目标优化，提供工程参数和落地清单。

### [Heretic：通过表示工程实现 Abliteration 的审查解除](/posts/2025/11/17/heretic-representation-engineering-abliteration/)
- 日期: 2025-11-17T09:01:21+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Heretic 工具，在 LLM 推理时通过表示工程的 abliteration 技术选择性解除被审查 token 的绑定，实现自动审查移除。

### [Heretic 中的选择性去审查：针对特定表示向量的主题敏感安全机制](/posts/2025/11/17/selective-uncensoring-in-heretic/)
- 日期: 2025-11-17T08:46:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 Heretic 中实现选择性去审查，通过针对特定表示向量编辑主题敏感的 LLM 安全对齐，实现细粒度控制而不破坏全局性能。