# 分类：ai-systems

> 该分类下的文章按时间倒序排列，便于按主题继续深挖。

## 页面摘要
- 路径: /categories/ai-systems/page/59/
- 当前页: 59 / 75
- 文章总数: 5960
- 当前页文章数: 80

## 快速导航
- [首页](/)
- [分类索引](/categories/)
- [归档索引](/archive/)

## 本页文章
### [欺骗分词器：字符级对抗攻击如何绕过LLM的安全防线](/posts/2025/10/14/deceiving-the-tokenizer-how-character-level-adversarial-attacks-bypass-llm-safeguards/)
- 日期: 2025-10-14T08:19:08+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 大型语言模型（LLM）的安全性不仅取决于语义理解，更隐藏在字符处理的底层细节中。本文揭示了利用Unicode和编码技巧进行字符级对抗攻击的机制、风险及其在工程实践中的防御策略。

### [逆向工程揭秘：从泄露的系统提示词看大模型的设计与安全](/posts/2025/10/14/reverse-engineering-leaked-llm-system-prompts/)
- 日期: 2025-10-14T08:07:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入分析泄露的ChatGPT、Claude等模型系统提示词，揭示其角色设定、能力边界与安全护栏的实现机制，并探讨开发者如何借鉴与防范。

### [解构 Claude Code：自然语言如何驱动多步 Git 工作流](/posts/2025/10/14/claude-code-agentic-git-workflows/)
- 日期: 2025-10-14T07:18:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入剖析 Claude Code 如何将模糊的自然语言指令转化为精确、有序的 Git 操作序列，探讨其背后的意图识别、状态管理与命令生成机制。

### [光学热力学：无需开关，让光自我寻路的革命性方法](/posts/2025/10/14/optical-thermodynamics-a-revolutionary-method-for-self-routing-light-without-switches/)
- 日期: 2025-10-14T07:04:12+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 抛弃复杂的开关阵列，一种名为“光学热力学”的新兴框架利用热力学原理，让光在非线性系统中自我导航并汇聚到指定路径，为下一代光计算和网络技术开辟了全新的工程思路。

### [深入 llama.cpp：剖析 ggml 张量库与 GGUF 文件格式](/posts/2025/10/14/ggml-and-gguf-the-backbone-of-efficient-llm-inference/)
- 日期: 2025-10-14T06:04:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入分析 `llama.cpp` 背后的核心技术：`ggml` 张量库和 GGUF 文件格式。本文将探讨它们如何通过高效的量化方法和内存管理，在各种硬件上实现可移植的、高性能的大型语言模型推理。

### [Klavis AI: 剖析其用于工具组合的开发者抽象层](/posts/2025/10/14/analyzing-klavis-ais-developer-abstractions-for-tool-composition/)
- 日期: 2025-10-14T03:03:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Klavis 通过 MCP 和 Strata 抽象，在易用性与表现力之间取得了平衡。本文深入探讨其 SDK 和 API 设计，为开发者在构建多工具 AI 工作流时提供决策依据。

### [Klavis AI：面向智能体工具的可靠性架构：状态管理与错误处理](/posts/2025/10/14/klavis-agent-tool-reliability-state-error-handling/)
- 日期: 2025-10-14T02:08:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 当 AI 智能体执行多步工具调用时，如何保证任务不因短暂中断或意外错误而失败？本文深入探讨 Klavis AI 如何通过其 MCP 架构解决状态管理和错误处理两大核心挑战，为大规模、可靠的智能体工具集成提供工程化实践。

### [从零构建百元级 ChatGPT：Andrej Karpathy 的 NanoChat 实战指南](/posts/2025/10/14/hands-on-guide-to-building-a-100-dollar-chatgpt-with-nanochat/)
- 日期: 2025-10-14T01:02:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Andrej Karpathy 的 NanoChat 项目，本文提供一份从零开始构建一个小型 ChatGPT 系统的实战指南，覆盖了从数据准备、模型训练到在 100 美元预算内完成部署的全过程。

### [通过Jupyter Notebook掌握提示工程：Anthropic的互动教程](/posts/2025/10/14/mastering-prompt-engineering-with-jupyter-notebooks-anthropics-interactive-tutorial/)
- 日期: 2025-10-14T00:07:21+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 一份深入的指南，介绍如何利用Anthropic提供的互动式Jupyter Notebook教程，系统地学习从基础到高级的提示工程技术，并应用于实际场景。

### [Nitro.js：为任何部署环境打造的极简服务器工具包](/posts/2025/10/14/nitrojs-minimalist-server-toolkit-for-any-deployment/)
- 日期: 2025-10-14T00:03:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析 Nitro.js 如何通过其可扩展的插件系统和与部署环境无关的设计，为现代 Web 服务器提供一个最小化但功能完备的工具包核心，实现真正的“一次编码，随处部署”。

### [Archon OS 架构解析：为 AI 编程助手构建基于图的知识管理系统](/posts/2025/10/13/archon-os-architecture-breakdown-graph-based-knowledge-management-for-ai-coding-assistants/)
- 日期: 2025-10-13T22:09:22+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入分析 Archon OS 如何利用微服务和向量数据库为 AI 编程助手提供长期记忆和状态化任务执行能力，构建强大的外部知识图谱。

### [AI驱动的SQL验证：超越传统解析器的技术演进](/posts/2025/10/13/ai-driven-sql-validation-beyond-traditional-parsers/)
- 日期: 2025-10-13T17:19:48+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨现代SQL验证如何从严格的AST语法树解析，演进为以AI为核心的意图理解与错误修复。分析AI在处理多方言、模糊语法和语义检查方面的优势与挑战。

### [将《我的世界》捆绑包问题建模为 Z3 约束求解](/posts/2025/10/13/modeling-minecraft-bundles-for-z3-constraint-solving/)
- 日期: 2025-10-13T15:20:40+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文详细介绍了如何将《我的世界》中复杂的捆绑包（Bundle）物品填充规则，精确地翻译成 Z3 约束求解器可以理解的数学模型，聚焦于物品堆叠、容器限制的形式化表达。

### [从游戏到数学：将《我的世界》捆绑包问题精确建模为 Z3 约束](/posts/2025/10/13/modeling-minecraft-bundle-packing-as-a-z3-constraint-problem/)
- 日期: 2025-10-13T15:19:00+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文深入探讨如何将《我的世界》中独特的捆绑包（Bundle）物品存放机制，精确地翻译成Z3约束求解器可以理解的数学模型。我们将聚焦于物品堆叠、容量权重和整数约束的建模技术，提供一个从游戏规则到形式化约束的入门指南。

### [MinerU 中的分层表格检测：轮廓检测与 rowspan 合并](/posts/2025/10/13/hierarchical-table-detection-in-mineru/)
- 日期: 2025-10-13T11:49:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 MinerU 的轮廓检测和 rowspan 合并技术，从多列 PDF 中提取嵌套表格，确保 LLM RAG 管道的语义 Markdown 输出无数据丢失。

### [使用 Spring AI Alibaba 实现 Java 中的响应式多代理编排](/posts/2025/10/13/using-spring-ai-alibaba-for-reactive-multi-agent-orchestration-in-java/)
- 日期: 2025-10-13T11:32:54+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 Spring AI Alibaba Graph 框架，集成 LLM 和工具，实现响应式多代理工作流，支持流式输出、企业级集成与可扩展监控。

### [TensorFlow Lite 边缘设备入门部署：量化、微控制器集成与 IoT 调优](/posts/2025/10/13/tensorflow-lite-edge-devices-beginner-deployment-quantization-microcontroller-integration-and-iot-tuning/)
- 日期: 2025-10-13T10:47:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 介绍使用 TensorFlow Lite 在边缘设备部署 ML 模型的基础指南，重点覆盖量化技术、微控制器集成以及针对 IoT 的性能优化参数。

### [Daytona：多租户环境中AI生成代码的安全容器隔离与动态缩放实现](/posts/2025/10/13/daytona-secure-container-isolation-dynamic-scaling-ai-code-execution/)
- 日期: 2025-10-13T10:32:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨Daytona如何通过容器隔离、动态资源缩放和策略执行，确保多租户环境下AI生成代码的安全高效运行。

### [利用 Spring Boot 响应式流实现事件驱动的多代理协调](/posts/2025/10/13/leveraging-spring-boot-reactive-streams-for-event-driven-multi-agent-orchestration/)
- 日期: 2025-10-13T10:06:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Spring AI Alibaba Graph，利用响应式流构建事件驱动的多代理系统，支持 LLM 链式调用与工具调用，提升企业级 AI 应用的扩展性和响应速度。

### [Emacs Agent Shell 与 ACP 协议集成：自然语言命令的多代理执行](/posts/2025/10/13/emacs-agent-shell-acp-protocol-integration/)
- 日期: 2025-10-13T10:02:36+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文探讨如何将 ACP 协议集成到 Emacs agent-shell 中，实现自然语言命令通过多代理协调在编辑器中的无缝执行，提供工程化参数和监控要点。

### [Claude Code 中多代理 Git 操作的编排：自动化分支、PR 生成、合并冲突解决](/posts/2025/10/13/orchestrating-multi-agent-git-operations-in-claude-code/)
- 日期: 2025-10-13T09:18:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Claude Code 的多代理框架，实现 Git 工作流的自动化协调，包括分支管理、PR 生成与冲突解决，提供终端自然语言命令的参数配置与验证策略。

### [ATLAS 中的自适应学习机制：通过在线模型更新动态优化推测解码树，实现 2 倍推理加速](/posts/2025/10/13/adaptive-learning-in-atlas/)
- 日期: 2025-10-13T08:48:42+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 介绍 ATLAS 系统中的自适应学习技术，利用运行时在线更新动态精炼推测解码树，在不需完整重新训练的情况下实现 LLM 推理 2 倍加速。

### [Claude Code 终端集成与嵌入式语义理解](/posts/2025/10/13/claude-code-terminal-integration-embeddings/)
- 日期: 2025-10-13T08:33:43+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 TypeScript 的终端代理编码工具，通过代码库嵌入实现语义理解、自然语言 Git 工作流及 LLM 自动化任务的参数配置与实现要点。

### [Claude Code Templates CLI 监控仪表板工程化实践](/posts/2025/10/13/claude-code-templates-cli-monitoring-dashboards/)
- 日期: 2025-10-13T08:17:44+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Claude Code CLI 模板的集成监控仪表板设计，聚焦代理性能指标、错误日志记录与资源利用率监控，实现终端 AI 编码工作流的可靠工程化。

### [在 ATLAS 推测解码中实现内核融合：减少 75% 内存带宽并实现 4x LLM 推理加速](/posts/2025/10/13/implement-kernel-fusion-in-atlas-speculative-decoding/)
- 日期: 2025-10-13T07:32:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文聚焦 ATLAS 系统的推测解码优化，通过 CUDA 内核融合减少 75% 内存带宽，实现多 GPU 上 4x LLM 推理加速，提供动态 draft 模型适应参数与工程落地清单。

### [使用 TensorFlow Lite Micro 在微控制器上实现高效机器学习推理](/posts/2025/10/13/implementing-efficient-ml-inference-with-tensorflow-lite-micro-on-microcontrollers/)
- 日期: 2025-10-13T06:48:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向微控制器高效 ML 推理，给出 TFLM 量化部署与电池优化的工程参数与监控要点。

### [ATLAS 中实现自适应草稿模型训练：动态学习推测模式与阈值调整](/posts/2025/10/13/adaptive-speculation-learning-in-atlas/)
- 日期: 2025-10-13T06:18:19+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 ATLAS 系统中，通过历史验证动态学习推测模式，调整接受阈值，提升多 GPU LLM 推理效率的工程实践与参数配置。

### [Emacs 中集成 ACP 协议的 agent-shell：实现自然语言命令和多代理编排](/posts/2025/10/13/integrating-acp-protocol-in-emacs-agent-shell-seamless-natural-language-commands-and-multi-agent-orchestration/)
- 日期: 2025-10-13T06:04:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 ACP 协议在 Emacs 中构建 agent-shell，支持自然语言交互、工具调用和多代理协作，提供配置参数和监控要点。

### [使用约束满足求解器优化 Minecraft 物品捆绑](/posts/2025/10/13/optimizing-minecraft-bundles-with-constraint-satisfaction-solvers/)
- 日期: 2025-10-13T05:48:00+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 Minecraft 物品捆绑优化，给出约束满足问题的建模与回溯算法的工程化参数与监控要点。

### [Deploying Optimized AI Models on Edge Devices with ONNX Runtime](/posts/2025/10/13/deploying-optimized-ai-models-on-edge-devices-with-onnx-runtime/)
- 日期: 2025-10-13T05:04:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 ONNX Runtime 在边缘设备上实现高效本地推理，涵盖量化、硬件加速及与 Windows ML 框架的集成，提供工程参数和最佳实践。

### [在 PyTorch Diffusers 中实现管道并行、LoRA 微调与自定义噪声调度器：可扩展图像/视频/音频生成工程实践](/posts/2025/10/13/implementing-pipeline-parallelism-lora-fine-tuning-custom-noise-schedulers-in-diffusers-pytorch/)
- 日期: 2025-10-13T04:48:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Hugging Face Diffusers，阐述管道并行分布式推理、LoRA 高效微调及自定义噪声调度器的 PyTorch 实现，提供参数配置与优化清单。

### [Together AI 多GPU服务中混合长度LLM请求的动态批处理实现：优化填充与排序策略](/posts/2025/10/13/dynamic-batching-mixed-length-llm-requests-together-ai-multi-gpu-serving/)
- 日期: 2025-10-13T04:17:41+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨在Together AI平台上实现动态批处理以处理变长序列LLM请求，优化填充策略和多GPU分布，提升吞吐量而无需固定批大小。提供工程参数和监控要点。

### [使用 agent-shell v0.5 提升代理工作流：工具调用链与状态持久化](/posts/2025/10/13/enhance-agent-workflows-v0-5-updates/)
- 日期: 2025-10-13T03:34:37+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: agent-shell v0.5 通过 ACP 协议优化工具调用链、会话状态管理和多步错误恢复，提供 Emacs 原生代理集成的工程参数与监控要点。

### [Together AI 多GPU动态批处理与张量并行：处理变长序列实现亚100ms延迟与2倍吞吐提升](/posts/2025/10/13/dynamic-batching-and-tensor-parallelism-in-together-ai-multi-gpu-setups/)
- 日期: 2025-10-13T03:18:48+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在Together AI的多GPU环境中，实现动态请求批处理与张量并行，优化变长序列推理，达到亚100ms延迟并比静态方法提升2倍吞吐，提供工程参数与监控要点。

### [在 ESP32 上实现 MCP 协议用于嵌入式聊天机器人](/posts/2025/10/13/implementing-mcp-on-esp32-for-embedded-chatbot/)
- 日期: 2025-10-13T03:05:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 MCP 协议在 ESP32 上的集成，实现低功耗 AI 聊天机器人的边缘部署与本地语音交互。

### [Together AI 的推测解码内核融合优化：多GPU上4倍加速的内存带宽减法](/posts/2025/10/13/optimizing-llm-inference-with-kernel-fusion-in-speculative-decoding-4x-speedup-on-multi-gpu-via-memory-bandwidth-reduction/)
- 日期: 2025-10-13T02:19:57+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Together AI 通过在推测解码中应用内核融合技术，融合 attention 和 MLP 操作，显著降低内存带宽消耗，实现多 GPU 环境下 LLM 推理 4 倍加速。文章提供工程参数、阈值设置与监控要点。

### [使用 C# 构建上下文感知桌面 AI 助手：多 LLM 与 MCP 工具集成](/posts/2025/10/13/building-context-aware-desktop-ai-with-csharp-and-multi-llm-integration/)
- 日期: 2025-10-13T02:07:48+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 C# 和 Avalonia 框架，开发支持多模型 LLM 及 MCP 工具的桌面 AI 助手，实现屏幕上下文感知与工作流自动化，提供配置参数与部署清单。

### [用 Lobe Chat 构建可扩展 AI 聊天 UI：多 LLM 编排与文件 RAG 集成](/posts/2025/10/13/building-extensible-ai-chat-ui-with-lobe-chat-multi-llm-orchestration-and-file-based-rag/)
- 日期: 2025-10-13T00:33:52+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探索 Lobe Chat 的插件系统如何实现多模型 LLM 协调、文件 RAG 检索，以及通过 MCP 市场集成 artifact 渲染，提供工程化参数和部署指南。

### [Coze Studio 视觉 AI 代理构建平台：工作流编辑与 LLM 集成实践](/posts/2025/10/13/visual-ai-agent-builder-with-coze-studio/)
- 日期: 2025-10-13T00:18:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Coze Studio 作为开源视觉平台，简化 AI 代理开发。通过拖拽工作流、集成 LLM 和插件工具链，实现高效调试与自动化部署，提供工程化参数与落地策略。

### [Daytona 容器中启用 GPU 直通：低延迟 AI 代码执行的加速策略](/posts/2025/10/12/enabling-gpu-passthrough-in-daytona-containers-for-low-latency-ai-code-execution/)
- 日期: 2025-10-12T23:47:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Daytona 中容器 GPU 直通的实现，提供动态资源隔离、安全访问控制的参数配置与最佳实践。

### [Together AI 中使用内核融合的推测解码工程实践：实现 4x LLM 推理加速](/posts/2025/10/12/together-ai-speculative-decoding-with-kernel-fusion/)
- 日期: 2025-10-12T23:32:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Together AI 如何通过推测解码和内核融合优化 LLM 推理，焦点低延迟 token 生成和硬件参数配置，实现 4x 加速。

### [工程化 MinerU 实现 PDF 到 Markdown 的布局、矢量图形与数学公式保留](/posts/2025/10/12/engineering-mineru-layout-preserving-pdf-extraction/)
- 日期: 2025-10-12T23:18:51+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 MinerU 在 PDF 转换中的工程实践，聚焦布局保留、矢量图形提取及数学公式重建，确保多模态 LLM 准确摄入文档内容。

### [ESP32 上部署 MCP 协议实现低功耗边缘聊天机器人](/posts/2025/10/12/deploying-mcp-protocol-on-esp32-for-low-power-edge-chatbot/)
- 日期: 2025-10-12T23:03:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 ESP32 上利用 MCP 协议构建低功耗边缘聊天机器人，结合轻量 NLP 预处理、占空比 WiFi 连接和本地意图识别，减少云端依赖并优化能耗管理。

### [构建 Klavis MCP 集成层：AI 代理可靠调用外部工具的容错路由与缓存](/posts/2025/10/12/building-klavis-mcp-integration-layers-for-reliable-ai-agent-tool-invocation/)
- 日期: 2025-10-12T21:17:33+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 AI 代理工具调用，给出 Klavis MCP 集成层的标准化协议、容错路由和缓存机制的工程化参数与监控要点。

### [使用 C# 构建上下文感知桌面 AI：多 LLM 与 MCP 工具的无缝集成](/posts/2025/10/12/seamlessly-integrate-llms-mcp-desktop-ai-assistant-csharp/)
- 日期: 2025-10-12T20:17:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Everywhere 项目，探讨如何用 C# 实现多模型 LLM 和 MCP 工具的桌面集成，支持实时应用交互和 NLP 处理。

### [MinerU：复杂 PDF 解析到 LLM 友好 Markdown 的布局分析与表格提取实践](/posts/2025/10/12/mineru-parsing-complex-pdfs-to-llm-ready-markdown-with-layout-analysis-and-table-extraction/)
- 日期: 2025-10-12T20:06:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 MinerU 的 pipeline 和 vlm 后端，实现复杂 PDF 的布局分析、表格提取和 OCR，支持 LLM 友好输出格式，确保 RAG 管道高效摄入。

### [Diffusers 中实现管道并行、LoRA 微调与自定义噪声调度器](/posts/2025/10/12/implementing-pipeline-parallelism-lora-fine-tuning-custom-noise-schedulers-in-diffusers/)
- 日期: 2025-10-12T20:03:13+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对生产 AI 系统，提供 Diffusers 管道并行、LoRA 微调和自定义噪声调度器的参数配置与优化策略。

### [用 Daytona 构建 AI 生成代码的安全弹性基础设施：容器隔离、动态缩放与政策执行](/posts/2025/10/12/building-secure-elastic-infrastructure-for-ai-generated-code-with-daytona-container-isolation-dynamic-scaling-and-policy-enforcement/)
- 日期: 2025-10-12T19:17:30+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 AI 生成代码的安全执行，给出 Daytona 的容器隔离、动态缩放和政策执行的工程化参数与监控要点。

### [使用 Spring AI Alibaba 构建响应式多代理系统](/posts/2025/10/12/building-reactive-multi-agent-systems-with-spring-ai-alibaba/)
- 日期: 2025-10-12T19:02:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 Java 开发者，利用 Spring AI Alibaba 的 Graph 框架构建响应式多代理系统，实现 LLM 协调与实时工作流。

### [Together AI 通过内核融合与量化训练实现 4x LLM 推理加速](/posts/2025/10/12/implementing-4x-faster-llm-inference-together-ai/)
- 日期: 2025-10-12T18:47:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Together AI 的 Inference Engine，利用内核融合、量化感知训练和 GPU Tensor Core 优化，实现实时应用的 4x LLM 推理加速，提供工程参数与监控要点。

### [Coral协议中的代理发现与协商：语义注册与匹配机制工程化](/posts/2025/10/12/agent-discovery-and-negotiation-in-coral-protocol/)
- 日期: 2025-10-12T18:32:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨Coral协议中代理注册的语义搜索与能力匹配协议，用于去中心化AI代理网络的动态发现与协商，提供工程参数与监控要点。

### [基于 Claude Code 的终端代理工作流工程化：代码库嵌入与自然语言 Git 操作](/posts/2025/10/12/engineering-terminal-agentic-workflows-with-claude-code/)
- 日期: 2025-10-12T18:18:10+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何利用 Claude Code 构建终端代理，实现代码库的语义理解、自然语言 Git 工作流以及自动化例行任务的工程参数与最佳实践。

### [多模型AI管道中集成Supermemory API实现持久会话状态管理](/posts/2025/10/12/integrate-supermemory-api-for-persistent-session-state-in-multi-model-ai-pipelines/)
- 日期: 2025-10-12T18:07:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何利用Supermemory API在多模型AI系统中实现会话状态持久化，通过zero-copy共享和增量更新确保低延迟回忆，提升推理链效率。

### [基于 libp2p 的 P2P 网络与 DID 认证：实现 Coral Protocol 中安全的去中心化 AI 代理通信](/posts/2025/10/12/libp2p-based-p2p-networking-with-did-authentication-for-secure-decentralized-ai-agent-communication-in-coral-protocol/)
- 日期: 2025-10-12T17:03:12+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨在 Coral Protocol 中使用 libp2p 构建 P2P 网络，并结合 DID 认证实现协议无关的消息路由与安全通信的工程参数和监控要点。

### [ReFAG 检索工程实现：自适应分块、MinHash 近重复检测与内存高效向量融合](/posts/2025/10/12/engineering-refag-retrieval-adaptive-chunking-minhash-fusion/)
- 日期: 2025-10-12T15:48:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 ReFAG 在长上下文 AI 系统中的工程优化，包括自适应分块策略、基于 MinHash 的去重机制，以及向量融合技术，以提升检索效率和内存利用率。

### [Qwen3-VL 中长序列视频理解的工程化：时序注意力和令牌压缩](/posts/2025/10/12/engineering-temporal-attention-and-token-compression-for-long-sequence-video-in-qwen3-vl/)
- 日期: 2025-10-12T14:48:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 Qwen3-VL 多模态 LLM 的长序列视频处理，给出时序注意力机制与令牌压缩的工程参数配置、优化策略与监控要点。

### [Supermemory 中的混合向量-图索引：实时增量更新与边缘部署优化](/posts/2025/10/12/hybrid-vector-graph-indexing-supermemory-edge-api/)
- 日期: 2025-10-12T14:32:12+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Supermemory 通过混合向量和图索引实现高效的 AI 代理记忆 API，支持实时增量更新和零拷贝共享，适用于边缘部署。文章探讨工程参数、监控要点和落地清单。

### [SQLBot 中 RAG 增强的 Text-to-SQL 实现：Schema 检索与提示调优](/posts/2025/10/12/implementing-rag-enhanced-text-to-sql-in-sqlbot/)
- 日期: 2025-10-12T14:07:16+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 SQLBot 如何通过 RAG 技术实现 schema 检索、复杂查询提示调优、验证层和安全执行，提升 BI 分析效率。

### [工程化 Coral 协议：实现代理互操作的去中心化基础设施](/posts/2025/10/12/engineering-coral-protocol-decentralized-infrastructure-for-agent-interoperability/)
- 日期: 2025-10-12T13:32:21+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用可验证计算、安全消息传递和任务委托，Coral 协议构建可扩展的 Internet of Agents，详述工程参数与落地策略。

### [SurfSense RAG 中 YouTube 字幕的分块与嵌入优化：提升语义检索精度与处理变异语音模式](/posts/2025/10/12/optimizing-chunking-embedding-youtube-transcripts-surfsense-rag/)
- 日期: 2025-10-12T13:03:08+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 YouTube 字幕在 SurfSense RAG 中的处理，给出分块策略、嵌入模型选择及语义检索优化的工程参数与落地清单。

### [在 SurfSense RAG 中实现 API 限流、嵌入去重与 RRF 混合排序](/posts/2025/10/12/implementing-api-throttling-embedding-deduplication-and-rrf-hybrid-ranking-in-surfsense-rag/)
- 日期: 2025-10-12T12:17:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何在 SurfSense 中通过 API 限流避免速率限制、基于嵌入的去重减少冗余，以及 RRF 融合提升多源检索排名，提供工程参数与监控要点。

### [Anthropic 提示工程高级技巧：链式思考与 XML 标签提升 LLM 可靠性](/posts/2025/10/12/anthropic-advanced-prompt-engineering-tutorial/)
- 日期: 2025-10-12T11:03:25+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Anthropic Claude 模型中结构化提示的应用，如链式思考和 XML 标签，用于增强复杂推理和工具使用的可靠性，提供工程化参数与最佳实践。

### [Anthropic 高级提示工程教程：链式思考与 XML 标签提升 LLM 可靠性](/posts/2025/10/12/anthropic-advanced-prompt-engineering-tutorial-chain-of-thought-xml-tags/)
- 日期: 2025-10-12T11:02:15+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 应用链式思考和 XML 标签等结构化提示技巧，提升 Anthropic Claude 在复杂推理和工具使用中的可靠性。

### [Engineering Diffusion-Based Frame Consistency and Cross-Modal Alignment for Paper-to-Video Generation](/posts/2025/10/12/engineering-diffusion-based-frame-consistency-and-cross-modal-alignment-for-paper-to-video-generation/)
- 日期: 2025-10-12T10:47:53+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对多模态科学论文内容，提供基于扩散模型的帧一致性和跨模态对齐工程实践，实现直接生成高质量叙述视频的关键参数与策略。

### [将 Slack 和 Notion API 集成到 SurfSense RAG 管道：OAuth 认证、增量同步与语义去重](/posts/2025/10/12/integrating-slack-and-notion-apis-into-surfsense-rag-pipeline/)
- 日期: 2025-10-12T10:17:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向团队协作工具，给出 Slack/Notion 与 SurfSense RAG 的集成方案，包括认证流程、数据同步参数与去重策略。

### [LLM 管道：科学论文到动画视频生成](/posts/2025/10/12/llm-pipelines-for-scientific-paper-to-animated-video-generation/)
- 日期: 2025-10-12T10:02:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 LLM 解析学术论文，提取视觉与叙述元素，利用文本到图像扩散模型和时序插值生成平滑动画视频的工程化实践。

### [Engineering LLM Pipelines for Personalized Media Generation](/posts/2025/10/12/engineering-llm-pipelines-for-personalized-media-generation/)
- 日期: 2025-10-12T09:02:31+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 构建 LLM 管道，支持个性化媒体生成，融合 RAG 检索增强、实时内容适应及多模态输出格式化，提供工程参数和落地清单。

### [剖析 REFRAG：Meta 超级智能首篇论文中的可扩展 AGI 创新](/posts/2025/10/12/dissecting-refag-innovations-meta-superintelligence-debut-paper/)
- 日期: 2025-10-12T08:18:51+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Meta 超级智能实验室首篇论文 REFRAG 框架，在 RAG 解码中的技术创新，提供安全、可扩展 AGI 架构的参数与策略。

### [使用 Claude Code 进行零-shot 代码库探索](/posts/2025/10/12/zero-shot-codebase-exploration-with-claude-code/)
- 日期: 2025-10-12T07:47:54+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 工程化零-shot 导航陌生代码库，通过 Claude 的代理解析实现终端任务自动化，无需配置或训练。

### [Engineering RAG Pipeline in SurfSense for YouTube Transcripts and GitHub Code Snippets Integration](/posts/2025/10/12/engineering-rag-pipeline-in-surfsense-for-youtube-transcripts-and-github-code-snippets-integration/)
- 日期: 2025-10-12T07:33:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 SurfSense 中，通过 API 获取 YouTube 视频转录和 GitHub 代码片段，利用嵌入模型和混合语义-BM25 排名构建 RAG 管道，实现高效的 AI 上下文检索与应用。

### [SurfSense RAG管道中集成实时搜索引擎：API节流、结果去重与BM25-语义混合排名](/posts/2025/10/12/integrating-real-time-search-into-surfsense-rag-throttling-deduplication-hybrid-ranking/)
- 日期: 2025-10-12T07:04:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在SurfSense RAG系统中集成Tavily等实时搜索引擎，优化API调用节流、结果去重机制，以及BM25与语义混合排名策略，提升AI代理的动态知识检索效率。

### [Qwen3-VL 多图像序列推理与文档布局解析：动态视觉令牌合并与跨模态注意力](/posts/2025/10/12/qwen3-vl-multi-image-sequential-reasoning-and-document-layout-parsing/)
- 日期: 2025-10-12T06:18:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向视觉文档的多图像推理与布局分析，给出 Qwen3-VL 中的动态视觉令牌管理、跨模态注意力配置及工程落地参数。

### [Claude Code 多代理配置的高级 CLI 模板定制：语义导航与 Git 工作流监控](/posts/2025/10/12/advanced-cli-customization-for-claude-code-multi-agent-configurations/)
- 日期: 2025-10-12T05:49:24+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过工程化 CLI 模板自定义 Claude Code 多代理配置，实现终端 AI 编码中的细粒度监控，包括语义导航和 Git 工作流参数优化。

### [Qwen3-VL 批量多模态推理工程化：共享视觉编码器缓存与动态批处理优化](/posts/2025/10/12/batched-multimodal-inference-qwen3-vl-optimizations/)
- 日期: 2025-10-12T05:20:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 Qwen3-VL 的并发多模态查询，介绍共享视觉编码器缓存和动态批处理的技术实现与参数调优，实现高吞吐量下的 40% 延迟优化。

### [Qwen3-VL 的批量多模态推理工程化：共享视觉编码器缓存与动态批处理优化](/posts/2025/10/12/batched-multimodal-inference-qwen3-vl/)
- 日期: 2025-10-12T05:18:38+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 Qwen3-VL 模型，探讨批量推理管道的工程实现，利用共享缓存和动态批处理降低高并发查询延迟 40%，包括参数配置与监控要点。

### [DDN 中树状离散潜在表示的工程实践：分层自回归采样与路径编码实现可扩展零-shot 条件图像生成](/posts/2025/10/12/engineering-tree-structured-discrete-latents-in-ddn-for-scalable-zero-shot-conditional-image-generation/)
- 日期: 2025-10-12T04:04:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 DDN 架构中树状离散潜在表示的工程细节，通过分层自回归采样和路径编码，实现高效零-shot 条件图像生成，包括参数配置与优化策略。

### [Claude-Code 中多代理 Git 工作流编排：分支、合并与冲突解决](/posts/2025/10/12/multi-agent-git-orchestration-in-claude-code/)
- 日期: 2025-10-12T03:05:53+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨在终端 AI 编码工具 Claude-Code 中，通过多代理协作实现自动化 Git 操作，包括自然语言驱动的分支管理、合并流程和冲突解析，提供工程化参数与最佳实践。

### [Integrating Jira and Linear APIs into SurfSense RAG for Real-Time Ticket Retrieval and Semantic Merging](/posts/2025/10/12/integrating-jira-linear-apis-into-surfsense-rag/)
- 日期: 2025-10-12T02:09:08+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何通过 SurfSense 的连接器将 Jira 和 Linear 集成到 RAG 系统中，实现实时 issue 同步、基于 embedding 的语义合并，以及 AI 生成的冲突解决摘要。提供配置参数和最佳实践。

### [使用 Microsoft Amplifier 工程化分布式 LLM 放大：异构 GPU 集群的高效扩展](/posts/2025/10/12/engineering-distributed-llm-amplification-microsoft-amplifier/)
- 日期: 2025-10-12T02:04:57+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Microsoft Amplifier (MS-AMP) 在异构 GPU 集群上实现 LLM 的分布式放大，聚焦负载均衡、容错机制与工程参数配置。

### [通过 RAG 工程化 LLM Text-to-SQL：模式检索、提示优化、查询验证与执行防护](/posts/2025/10/12/engineering-llm-text-to-sql-via-rag-schema-retrieval-prompt-optimization-query-validation-execution-safeguards/)
- 日期: 2025-10-12T00:47:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在复杂数据库中，利用 RAG 实现 LLM Text-to-SQL 的工程实践，包括 schema 检索、提示工程、查询校验及执行安全机制。
