# 分类：ai-systems

> 该分类下的文章按时间倒序排列，便于按主题继续深挖。

## 页面摘要
- 路径: /categories/ai-systems/page/65/
- 当前页: 65 / 75
- 文章总数: 5960
- 当前页文章数: 80

## 快速导航
- [首页](/)
- [分类索引](/categories/)
- [归档索引](/archive/)

## 本页文章
### [LaTeX-OCR 后轻量 NLP 模型解析模糊数学符号](/posts/2025/10/02/latex-ocr-post-nlp-disambiguation-handwritten-symbols/)
- 日期: 2025-10-02T09:16:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 LaTeX-OCR 基础上集成规则和嵌入匹配的 NLP 后处理，解决手写 delta 和 sigma 等符号歧义，提升教育工具转换准确性。

### [利用百万级令牌上下文的代理工作流取代 RAG：工具调用与低延迟推理](/posts/2025/10/02/engineering-agentic-workflows-with-million-token-contexts-to-supplant-rag/)
- 日期: 2025-10-02T09:03:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何通过 1M+ 令牌长上下文构建代理工作流，集成工具调用实现按需检索，以及多步推理在 500ms 延迟下解析查询的工程实践。

### [从 RAG 到利用大上下文窗口的代理系统的工程迁移](/posts/2025/10/02/engineering-migration-rag-to-agentic-systems-large-context-windows/)
- 日期: 2025-10-02T08:31:51+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文探讨从传统 RAG 向代理系统的工程迁移策略，利用扩展上下文窗口直接处理长形式查询，降低检索延迟并简化索引维护。提供可落地参数和监控要点。

### [利用扩展上下文窗口的Agentic工作流：从RAG向长文档直接洞察的转变](/posts/2025/10/02/agentic-shift-context-windows-long-documents/)
- 日期: 2025-10-02T08:07:25+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向长文档处理，给出利用LLM扩展上下文窗口的agentic工作流工程化参数与幻觉缓解策略。

### [Lobe Chat 中工程化 RAG 管道：文件上传知识库的向量搜索与多 LLM 编排](/posts/2025/10/02/engineering-rag-pipelines-in-lobe-chat-for-file-upload-knowledge-bases/)
- 日期: 2025-10-02T07:31:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Lobe Chat 中 RAG 管道的工程实践，包括文件处理、向量嵌入、检索优化及多模型集成，提供可落地配置与监控要点。

### [优化 OpenTSLM 用于 IoT 边缘部署：量化与流式推理实现实时时间序列异常检测](/posts/2025/10/02/optimizing-opentslm-for-edge-iot-anomaly-detection/)
- 日期: 2025-10-02T07:16:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过量化压缩和流式推理优化 OpenTSLM，实现 IoT 边缘实时异常检测，提供关键参数与部署清单。

### [OpenTSLM 实时异常检测整合：轻量级边缘推理与阈值警报](/posts/2025/10/02/integrating-opentslm-real-time-anomaly-detection-edge-inference/)
- 日期: 2025-10-02T06:46:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 将 OpenTSLM 应用于流式时间序列的实时异常检测，提供边缘部署和阈值警报的工程实践要点与参数配置。

### [使用 Colab 笔记本 curation LLM 学习路径：动手微调、RAG 实现与 Agent 构建](/posts/2025/10/02/curating-llm-learning-paths-with-colab-notebooks-for-hands-on-fine-tuning-rag-and-agents/)
- 日期: 2025-10-02T06:07:42+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 llm-course 的 Colab 笔记本，提供 LLM 微调、RAG 与 Agent 构建的实用路径与参数指南。

### [将 OpenTSLM 集成到流式管道中实现实时时间序列预测：自适应批处理与边缘部署优化](/posts/2025/10/02/integrating-opentslm-streaming-forecasting/)
- 日期: 2025-10-02T04:16:30+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 OpenTSLM 在流式环境下的集成策略，聚焦低延迟推理的自适应批处理和边缘部署参数配置。

### [MoneyPrinterTurbo 中 LLM 驱动的音频视频同步工程实践](/posts/2025/10/02/llm-driven-audio-video-sync-in-moneyprinterturbo/)
- 日期: 2025-10-02T04:07:25+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 MoneyPrinterTurbo 项目中通过时间戳对齐实现音频与视频同步的工程细节，包括 TTS、字幕生成和 moviepy 合成的最佳参数配置。

### [工程化模块化系统提示：Cursor 和 Devin 等 AI 工具的多轮推理与工具调用](/posts/2025/10/02/engineering-modular-system-prompts-ai-tools-cursor-devin/)
- 日期: 2025-10-02T03:31:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何设计模块化系统提示，支持 Cursor 和 Devin 等 AI 工具的多轮推理、工具调用模式及上下文管理，实现生产级代理工作流的关键参数与最佳实践。

### [工程化 Tinker 平台：模块化 AI 代理工作流](/posts/2025/10/02/engineering-tinker-platform-modular-ai-agent-workflows/)
- 日期: 2025-10-02T03:17:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向多模型环境，提供 Tinker 平台的工程实践、工具集成策略和状态管理参数。

### [使用 Claude Agent SDK 构建可扩展 AI 代理：工具集成与多步工作流编排](/posts/2025/10/02/building-scalable-ai-agents-with-claude-agent-sdk/)
- 日期: 2025-10-02T03:01:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Claude Agent SDK 集成工具、管理跨步骤状态，并处理生产工作流中的任务分解，实现可扩展 AI 代理构建。

### [部署 Vision Transformer 模型实现方程图像到 LaTeX 代码转换：束搜索解码与符号校正后处理](/posts/2025/10/02/deploying-vision-transformer-for-equation-image-to-latex-conversion-with-beam-search-and-symbol-correction/)
- 日期: 2025-10-02T02:46:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文介绍基于 ViT 的 LaTeX-OCR 模型部署，聚焦束搜索解码策略与符号校正后处理的技术实现与参数优化，提升手写与打印方程识别准确性。

### [利用 Unix 文件系统访问提升 Claude Code 的模块化实时代码生成](/posts/2025/10/02/leveraging-unix-filesystem-access-to-enhance-claude-code-modular-real-time-code-generation/)
- 日期: 2025-10-02T02:17:46+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 MCP Filesystem 服务器，Claude Code 实现直接文件访问，遵循 Unix 哲学，促进模块化、流式交互，实现高效开发工作流中的实时代码生成与解释。

### [初学者构建模块化 AI 代理：使用 Python 和 LangChain 在 Jupyter 中集成工具、记忆与规划](/posts/2025/10/02/building-modular-ai-agents-langchain-jupyter-beginners/)
- 日期: 2025-10-02T02:07:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 Jupyter notebooks 和 LangChain，学习构建多工具 AI 代理，涵盖工具集成、记忆管理和规划策略，实现高效任务自动化。

### [使用 OpenTSLM 工程化紧凑时间序列语言模型：领域特定分词与合成数据预训练](/posts/2025/10/02/engineering-compact-time-series-language-models-with-opentslm-domain-specific-tokenization-and-synthetic-data-pretraining/)
- 日期: 2025-10-02T02:01:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何通过领域特定分词、合成时间数据预训练和针对预测/异常任务的微调，构建紧凑的 LLM 用于时间序列，支持低延迟推理。

### [工程化 LLM 链式调用实现 AI_NovelGenerator 多章节小说生成：上下文连续性与检索增强提示优化](/posts/2025/10/02/engineering-llm-chaining-in-ai-novelgenerator-for-multi-chapter-novel-generation-context-continuity-via-retrieval-augmented-prompts/)
- 日期: 2025-10-02T01:17:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 AI_NovelGenerator 工具，工程化 LLM 链式生成多章节小说，确保情节连续、伏笔衔接和角色一致，通过上下文窗口管理和 RAG 提示。

### [使用 Claude Python SDK 实现多步 AI 代理工作流：工具调用、状态持久化和错误恢复编排](/posts/2025/10/01/implementing-multi-step-ai-agents-with-claude-python-sdk/)
- 日期: 2025-10-01T23:46:32+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 使用 Claude 的 Python SDK 构建多步 AI 代理，聚焦工具调用机制、状态持久化策略以及错误恢复的工程化实践。

### [AI-Driven Novel Serialization: Maintaining Multi-Chapter Context via Prompt Chaining](/posts/2025/10/01/ai-driven-novel-serialization-maintaining-multi-chapter-context/)
- 日期: 2025-10-01T22:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向多章节小说生成，给出提示链与状态管理的技术参数与工程实践要点。

### [部署 Vision Transformer 模型实现图像到 LaTeX 公式转换：IM2LaTeX 数据集训练与优化推理](/posts/2025/10/01/deploying-vision-transformer-for-image-to-latex-conversion/)
- 日期: 2025-10-01T22:31:29+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 LaTeX-OCR 项目，使用 ViT 模型将数学公式图像转换为 LaTeX 代码，涵盖 IM2LaTeX 数据集训练、tokenization 管道及高效推理部署要点。

### [构建 ChartDB 驱动的 AI 代理：交互式数据库 Schema 可视化与迭代优化](/posts/2025/10/01/building-chartdb-powered-ai-agent-for-interactive-db-schema-visualization-and-iterative-refinement/)
- 日期: 2025-10-01T22:19:14+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 ChartDB 和自然语言接口，构建 AI 代理实现数据库 Schema 的交互可视化、自动建议及迭代精炼。涵盖图查询、提示工程及落地参数，提升设计效率。

### [Cursor 1.7 AI代码助手架构：流式建议传输与IDE集成技术栈](/posts/2025/10/01/cursor-1-7-ai-code-assistant-architecture-streaming-suggestions/)
- 日期: 2025-10-01T22:12:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深度解析Cursor 1.7版本的AI代码助手架构，重点关注实时建议流式传输机制与IDE插件集成技术栈的实现细节。

### [MoneyPrinterTurbo模块化AI视频生成流水线架构分析](/posts/2025/10/01/moneyprinterturbo-modular-ai-video-generation-pipeline-architecture-analysis/)
- 日期: 2025-10-01T22:09:53+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析MoneyPrinterTurbo的模块化AI视频生成流水线架构，重点研究多模态资产检索、LLM编排和合成优化技术实现机制。

### [Cursor 1.7 AI代码助手架构：实时建议流式传输与IDE集成技术栈](/posts/2025/10/01/cursor-1-7-ai-code-assistant-architecture/)
- 日期: 2025-10-01T22:06:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析Cursor 1.7版本的AI代码助手架构，重点分析其实时建议流式传输机制与IDE插件集成技术栈的实现细节。

### [GitHub Copilot提示工程配置策略：系统化优化代码补全质量的工程实践](/posts/2025/10/01/github-copilot-prompt-engineering-configuration-strategy/)
- 日期: 2025-10-01T20:04:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入探讨GitHub Copilot提示工程的系统化配置方法，包括项目级别指令文件、工作区设置和代码内注释指令，提供优化代码补全质量与开发效率的工程实践指南。

### [LobeChat多AI提供商编排层：统一API差异与流式响应处理](/posts/2025/10/01/lobe-chat-multi-ai-provider-orchestration/)
- 日期: 2025-10-01T19:51:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析LobeChat如何构建多AI提供商统一编排层，处理OpenAI/Claude/Gemini/DeepSeek/Ollama/Qwen等42+提供商的API差异与流式响应，提供工程化的配置参数与最佳实践。

### [Handy离线语音识别实时性能优化：VAD滤波与Whisper硬件加速集成](/posts/2025/10/01/handy-offline-speech-recognition-optimization-vad-whisper-integration/)
- 日期: 2025-10-01T19:35:16+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入分析Handy项目的离线语音识别架构，提供VAD滤波参数优化与Whisper模型硬件加速的工程实践方案，实现亚秒级响应延迟。

### [WiFi信号到高分辨率图像的实时映射：GPU加速流水线优化](/posts/2025/10/01/wifi-imaging-gpu-acceleration-real-time-processing/)
- 日期: 2025-10-01T18:35:45+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对WiFi成像的实时高分辨率需求，深入分析GPU加速的信号处理流水线优化策略与工程实现参数。

### [AI代理循环中的容错恢复机制：工具调用失败时的多层恢复策略](/posts/2025/10/01/agentic-loops-error-recovery-mechanisms/)
- 日期: 2025-10-01T17:36:03+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对AI代理循环中20-40%的工具调用失败率，设计三层容错架构：工具级重试、工作流级恢复和系统级回退，提供具体参数配置与实现细节。

### [Silero VAD噪声过滤优化：实时离线语音识别的低延迟参数调优](/posts/2025/10/01/silero-vad-noise-filtering-optimization/)
- 日期: 2025-10-01T17:20:53+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对离线语音识别场景，深入分析Silero VAD参数调优策略，提供噪声环境自适应阈值算法和实时流水线延迟优化方案。

### [Handy离线语音识别中的Silero VAD参数调优与自适应噪声过滤](/posts/2025/10/01/handy-silero-vad-optimization/)
- 日期: 2025-10-01T17:05:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入Handy离线语音识别架构，聚焦Silero VAD参数调优与自适应噪声过滤策略的企业级部署工程实现细节。

### [Handy离线语音识别中VAD算法与噪声过滤模块的优化实践](/posts/2025/10/01/handy-vad-noise-filtering-optimization/)
- 日期: 2025-10-01T16:51:24+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对Handy开源语音转写工具的VAD模块，深入解析Silero VAD参数调优与噪声过滤策略，提供多场景配置模板与性能优化指南。

### [构建模块化AI视频生成流水线：MoneyPrinterTurbo架构解析与工程实践](/posts/2025/10/01/modular-ai-video-generation-pipeline-moneyprinterturbo-architecture-and-engineering-practices/)
- 日期: 2025-10-01T16:18:57+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析MoneyPrinterTurbo的模块化AI视频生成流水线架构，涵盖多模态合成、资产检索与质量评估组件的工程化实现方案。

### [WiFi信号逆散射成像算法：从CSI数据到高分辨率室内场景重建](/posts/2025/10/01/wifi-imaging-inverse-scattering-algorithms/)
- 日期: 2025-10-01T16:04:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入探讨基于WiFi信道状态信息的逆散射成像算法，包括MUSIC超分辨率技术、正则化方法和压缩感知重构，实现从射频测量数据到高分辨率室内场景图像的重建。

### [Databricks Kubernetes智能负载均衡架构解析](/posts/2025/10/01/databricks-kubernetes-intelligent-load-balancing/)
- 日期: 2025-10-01T14:10:02+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入分析Databricks在Kubernetes环境中实现智能负载均衡的技术架构，包括基于工作负载特征的动态路由算法和资源感知调度机制。

### [动态环境中epsilon-greedy与UCB bandit算法的regret分析与优化策略](/posts/2025/10/01/epsilon-greedy-ucb-bandit-dynamic-environment-regret-analysis/)
- 日期: 2025-10-01T12:49:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对动态环境下的多臂老虎机问题，深入分析epsilon-greedy和UCB算法的regret表现，并提出自适应参数调整策略。

### [Claude Python SDK工具调用实现：异步回调与错误恢复机制](/posts/2025/10/01/claude-python-sdk-tool-calling-implementation/)
- 日期: 2025-10-01T12:34:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析Anthropic Python SDK工具调用功能的异步回调处理、参数验证和错误恢复机制，提供工程化实现方案。

### [Genie世界模型推理加速：KV缓存优化与并行采样策略](/posts/2025/10/01/genie-inference-acceleration-kv-cache-optimization/)
- 日期: 2025-10-01T12:19:12+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对Google DeepMind Genie世界模型的推理性能优化，深入分析KV缓存内存瓶颈与并行采样策略，提供工程化实现方案与性能调优参数。

### [Handy离线语音识别引擎的模块化架构设计与性能优化策略](/posts/2025/10/01/handy-offline-speech-recognition-architecture/)
- 日期: 2025-10-01T12:09:01+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入分析Handy基于Tauri的离线语音识别架构，探讨其模块化音频流水线设计、Rust内存管理策略与跨平台性能优化实践。

### [DeepMind Genie世界模型的极简实现：潜在空间建模与动作条件生成](/posts/2025/10/01/deepmind-genie-minimal-implementation/)
- 日期: 2025-10-01T11:48:16+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于DeepMind Genie架构的极简实现，聚焦潜在空间离散化与动作条件生成的世界动态预测工程实践。

### [MCP服务器实时提示分析流水线：低延迟流式监控与模式检测](/posts/2025/10/01/mcp-prompt-analytics-low-latency-streaming/)
- 日期: 2025-10-01T11:19:17+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 构建MCP服务器的实时提示分析流水线，实现毫秒级流式监控和智能模式检测，优化AI代理的提示工程效率与系统性能

### [Thompson采样变体在动态多臂老虎机中的贝叶斯优化实现](/posts/2025/10/01/thompson-sampling-dynamic-bandits-bayesian-optimization/)
- 日期: 2025-10-01T11:03:49+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对动态环境设计Thompson采样变体，通过自适应先验分布调整与贝叶斯优化机制，优化多臂老虎机问题的探索-利用权衡。

### [MCP服务器实时流式提示分析：低延迟监控架构与毫秒级响应优化](/posts/2025/10/01/mcp-real-time-streaming-analytics-low-latency-monitoring/)
- 日期: 2025-10-01T10:34:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对MCP服务器的实时流式提示分析需求，深入解析三层架构设计与毫秒级低延迟监控的实现路径与技术参数。

### [PDF翻译中布局感知的数学方程处理](/posts/2025/10/01/layout-aware-math-equation-handling-in-pdf-translation/)
- 日期: 2025-10-01T08:06:57+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向AI驱动的PDF翻译，给出布局感知数学方程提取、翻译与LaTeX重新渲染的工程化参数与挑战应对。

### [在动态环境中实现 Epsilon-Greedy 和 UCB 老虎机算法](/posts/2025/10/01/implementing-epsilon-greedy-ucb-bandits-dynamic-environments/)
- 日期: 2025-10-01T06:48:21+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对动态决策系统，提供 epsilon-greedy 和 UCB 算法的工程实现、遗憾最小化参数及置信界探索策略。

### [使用 Claude Code 实现终端 AI 代理：Git 自动化与低延迟状态管理](/posts/2025/10/01/terminal-ai-agent-with-claude-code-for-git-automation/)
- 日期: 2025-10-01T06:32:54+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Claude Code 的终端 AI 代理，实现代码库探索、Git 工作流自动化和自然语言任务执行，重点优化低延迟状态管理参数。

### [构建 MCP 服务器实时提示分析引擎：跟踪 LLM 响应质量与异常检测](/posts/2025/10/01/building-real-time-prompt-analytics-for-mcp-servers/)
- 日期: 2025-10-01T05:17:14+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 MCP 服务器，设计实时提示分析引擎，用于监控 LLM 输出质量、识别异常并基于使用模式自动优化提示。提供工程参数、错误分类与落地清单。

### [晶圆级芯片高带宽互连工程](/posts/2025/10/01/wafer-scale-engine-interconnect-thermal-management/)
- 日期: 2025-10-01T04:32:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对Cerebras WSE，探讨高带宽互连与热管理设计，支持分布式AI训练，提供工程参数与监控要点。

### [Airweave：构建AI代理的语义搜索层，实现零代码SaaS数据接入](/posts/2025/10/01/airweave-building-semantic-search-layers-for-ai-agents/)
- 日期: 2025-10-01T04:17:58+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Airweave 通过语义搜索层，让 AI 代理自然语言查询任意 SaaS 应用数据，支持零代码集成和实时访问，提供工程化参数与监控要点。

### [LLM 编排资产生成与多模态合成：MoneyPrinterTurbo 的自动化视频生产实践](/posts/2025/10/01/llm-orchestrated-asset-retrieval-multi-modal-synthesis/)
- 日期: 2025-10-01T04:07:26+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 MoneyPrinterTurbo，探讨 LLM 驱动的资产生成、多模态融合与自动化视频制作的关键参数与优化策略。

### [工程化 Extract-0：针对非结构化文档的精确信息提取](/posts/2025/10/01/engineering-extract-0-for-document-info-extraction/)
- 日期: 2025-10-01T04:03:10+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Extract-0 等专用 LLM 的工程设计，通过针对性预训练提升非结构化文档信息提取精度，并与 RAG 管道集成实现可扩展部署。

### [Sora 2 中工程提示层次与一致性层：维持长视频角色身份与场景连贯性](/posts/2025/10/01/engineering-prompt-hierarchies-and-consistency-layers-for-sora-2-video-consistency/)
- 日期: 2025-10-01T03:32:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在Sora 2的扩散模型中，通过构建提示层次和一致性层，实现长形式视频生成的角色身份保持和场景连贯性，提供工程参数与落地清单。

### [工程化代理循环：结构化规划-执行-反思周期中的工具使用与错误恢复](/posts/2025/10/01/engineering-agentic-loops-structured-cycles-tool-use-error-recovery/)
- 日期: 2025-10-01T03:17:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨代理循环的工程设计，通过规划-执行-反思周期集成工具调用和错误恢复机制，实现鲁棒的多步AI自动化。提供可落地参数和监控要点。

### [基于Szeliski第二版工程化高效CV管道：特征匹配、多视图几何与经典-DL混合方法用于实时应用](/posts/2025/10/01/engineering-efficient-cv-pipelines-szeliski/)
- 日期: 2025-10-01T03:03:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从Szeliski第二版出发，探讨特征匹配、多视图几何及经典-DL混合在实时CV管道中的工程实践，提供优化参数与落地清单。

### [Building AI Design Verification Layers with Constraint Solvers: Detecting Spec Drifts via Multi-Turn Clarification and Symbolic Checks](/posts/2025/10/01/building-ai-design-verification-layers-with-constraint-solvers-detecting-spec-drifts-via-multi-turn-clarification-and-symbolic-checks/)
- 日期: 2025-10-01T02:32:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何通过约束求解器、多轮澄清提示和符号检查构建验证层，检测AI在设计规范中的偏差，确保工程输出的鲁棒性。提供参数配置和监控要点。

### [工程化时空扩散模型：Sora 2 中物理感知采样与可扩展 Transformer 骨干](/posts/2025/10/01/engineering-spatiotemporal-diffusion-models-sora-2-physics-aware-sampling-scalable-transformer-backbones/)
- 日期: 2025-10-01T01:18:07+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对文本生成长形式连贯视频，探讨 Sora 2 的时空扩散模型工程实践，焦点物理感知采样与可扩展 Transformer 骨干的设计优化。

### [Airweave：为 AI 代理构建应用 API 语义搜索层](/posts/2025/10/01/building-semantic-search-layers-for-ai-agents-over-app-apis/)
- 日期: 2025-10-01T00:32:07+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: Airweave 通过 API 自省和自然语言查询，实现零自定义集成的 AI 代理数据访问。探讨其语义搜索架构、Qdrant 集成及工程化参数，帮助开发者快速构建跨应用知识库。

### [工程化终端 Claude 代理：代码库理解与 Git 工作流自动化](/posts/2025/10/01/engineering-terminal-claude-agent-codebase-understanding-git-automation/)
- 日期: 2025-10-01T00:18:23+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向终端部署的 Claude AI 代理，给出代码库理解、自然语言任务执行与 Git 自动化的工程参数与安全清单。

### [PyTorch 从零实现 Transformer 基础 LLM：分词、架构、训练与 KV 缓存生成](/posts/2025/09/30/implementing-transformer-based-llm-from-scratch-in-pytorch/)
- 日期: 2025-09-30T23:48:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文基于 PyTorch 从零构建类似 ChatGPT 的 LLM，涵盖分词处理、Transformer 架构设计、训练循环实现，以及带 KV 缓存的自回归生成，提供工程化参数与代码清单。

### [从零用 PyTorch 实现 Transformer 解码器：自注意力和前馈层优化与自定义位置嵌入](/posts/2025/09/30/pytorch-transformer-decoder-from-scratch/)
- 日期: 2025-09-30T22:33:35+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 本文从零实现 Transformer 解码器块，聚焦自注意力与前馈层的 PyTorch 优化，并引入自定义位置嵌入以支持可扩展 LLM 训练。

### [PyTorch 模块化构建 LLM 组件：分词、嵌入、Transformer 块与自回归生成](/posts/2025/09/30/modular-pytorch-llm-components/)
- 日期: 2025-09-30T22:09:04+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 使用 PyTorch 从零实现大型语言模型的关键组件，包括分词处理、嵌入层、Transformer 块以及自回归生成机制，适用于自定义聊天模型的工程实践。

### [在代理商业协议中使用无状态 JWT 会话恢复：实现即时结账的多步 AI 编排](/posts/2025/09/30/stateless-jwt-session-resumption-agentic-commerce/)
- 日期: 2025-09-30T22:03:54+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对代理商业中的多步 AI 流程，给出基于 JWT 的无状态会话恢复设计、参数配置与监控策略。

### [工程模块化重构管道与自动化文档生成工具：缓解 LLM 代码库中的理解债务](/posts/2025/09/30/engineering-modular-refactoring-pipelines-and-automated-doc-gen-tools-to-reduce-comprehension-debt-in-llm-codebases/)
- 日期: 2025-09-30T20:17:11+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 LLM 生成代码的理解债务，介绍模块化重构管道和自动化文档工具的设计与实现要点，支持无重写维护。

### [用 TypeScript 构建 Handy 风格的离线语音转文本引擎](/posts/2025/09/30/typescript-offline-speech-to-text-engine-handy/)
- 日期: 2025-09-30T20:07:43+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Tauri 和本地 Whisper 模型，在 TypeScript 中实现实时隐私保护的离线 STT，提供模型选择、VAD 参数和性能优化指南。

### [Scheme-78 Lisp 微处理器设计：硬件加速与微码优化](/posts/2025/09/30/scheme-78-lisp-microprocessor/)
- 日期: 2025-09-30T19:48:59+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 Scheme Lisp 操作，设计 RISC 微处理器，包括 cons/car/cdr 硬件原语、标记内存 GC 支持，以及微码 eval/apply 实现，降低解释器开销。

### [使用 Claude Python SDK 构建模块化 AI 代理：多步协调、工具调用与状态管理](/posts/2025/09/30/building-modular-ai-agents-with-claudes-python-sdk-multi-step-orchestration-tool-calling-and-state-management/)
- 日期: 2025-09-30T19:33:18+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Claude Agent SDK，在 Python 中实现模块化 AI 代理的多步工作流协调、工具调用机制以及状态管理的工程实践与参数优化。

### [PDFMathTranslate：工程化 AI 驱动的科学 PDF 双语翻译，保留布局、数学公式与表格](/posts/2025/09/30/pdfmathtranslate-ai-preserved-format-translation/)
- 日期: 2025-09-30T19:18:10+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 PDFMathTranslate 工具，探讨科学 PDF 的 AI 翻译工程实践，包括 OCR 布局解析、多模态 LLM 翻译与格式重构管道，提供优化参数与部署清单。

### [集成 Claude 3.5 Sonnet 的计算机使用 API：实现 AI 代理的自主屏幕交互与任务自动化](/posts/2025/09/30/integrating-claude-35-sonnet-computer-use-api/)
- 日期: 2025-09-30T19:03:28+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Claude 3.5 Sonnet 的计算机使用 API 集成方法，提供工程化参数、监控要点和自动化任务清单，帮助开发者构建高效 AI 代理。

### [终端AI编码代理的多代理协调工程：并行任务执行、状态同步与低延迟反馈循环](/posts/2025/09/30/engineering-multi-agent-coordination-terminal-ai-coding-agents/)
- 日期: 2025-09-30T18:08:43+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向终端AI编码的多代理协调，给出并行执行、状态同步与反馈循环的工程参数与监控要点。

### [利用 Claude 3.5 Sonnet 的工具调用构建 RAG 结构化提取管道](/posts/2025/09/30/leverage-claude-3-5-sonnet-tool-calling-for-rag-structured-extraction/)
- 日期: 2025-09-30T16:33:34+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Claude 3.5 Sonnet 的工具调用能力，构建实时结构化 JSON 提取管道，提升 RAG 系统中的查询处理和数据验证效率。

### [Claude Sonnet 并行工具调用集成：面向代理工作流的并发API编排](/posts/2025/09/30/integrating-parallel-tool-calling-claude-sonnet-agentic-workflows/)
- 日期: 2025-09-30T16:08:16+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 将Claude Sonnet 4.5的并行函数调用集成到代理工作流，实现多步推理的并发API调用，降低延迟，提供参数配置与监控要点。

### [代理式商业中无状态 JWT 令牌的即时结账续传工程化](/posts/2025/09/30/engineering-stateless-jwt-for-instant-checkout-resumption-in-agentic-commerce/)
- 日期: 2025-09-30T16:02:57+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在AI代理驱动的商业场景下，探讨无状态JWT实现多步交易断线续传的工程参数、监控要点与回滚策略。

### [工程化分布式 AlphaFold 推理管道：GPU 编排加速分子生物学假设生成](/posts/2025/09/30/engineering-distributed-alphafold-inference-pipelines-with-gpu-orchestration/)
- 日期: 2025-09-30T15:47:56+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨构建分布式 AlphaFold 推理系统，利用 GPU 编排加速蛋白质结构预测，支持分子生物学中的快速假设生成与验证。提供架构设计、优化参数及工程实践要点。

### [Engineering Graph-Based AST Traversal and Semantic Indexing for AI Agents in HumanLayer](/posts/2025/09/30/engineering-graph-based-ast-traversal-and-semantic-indexing-for-ai-agents-in-humanlayer/)
- 日期: 2025-09-30T15:03:27+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 HumanLayer 项目中，探讨基于图的 AST 遍历和语义索引技术，帮助 AI 代理高效导航大型代码库，提供具体参数配置和优化策略，确保工程落地。

### [在 Redisearch 中实现向量量化：压缩高维嵌入以支持 AI 推荐系统的高效搜索](/posts/2025/09/30/implementing-vector-quantization-in-redisearch-for-ai-recommendations/)
- 日期: 2025-09-30T14:18:12+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 介绍向量量化在 Redisearch 中的应用，通过压缩高维嵌入实现高效存储和快速相似搜索，适用于 AI 推荐系统。

### [Claude Sonnet 4.5 并行工具调用的工程实践：并发调用、结果聚合与低延迟代理工作流](/posts/2025/09/30/engineering-parallel-function-calling-claude-sonnet-4-5/)
- 日期: 2025-09-30T13:51:39+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 Claude Sonnet 4.5 中并行多工具编排的实现，包括并发调用、结果聚合、错误重试策略，确保代理工作流在 100ms 内响应。

### [AI 开发代理的分层任务图：依赖解析、并行执行与实时进度跟踪](/posts/2025/09/30/hierarchical-task-graphs-for-ai-dev-agents/)
- 日期: 2025-09-30T12:50:55+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 AI 开发代理中，工程化分层任务图可有效协调复杂编码工作流。本文探讨依赖解析、并行执行机制及实时进度跟踪的实践要点，提供参数配置与监控清单。

### [HumanLayer 中可扩展的多代理协调协议设计](/posts/2025/09/30/scalable-multi-agent-coordination-protocols-in-humanlayer/)
- 日期: 2025-09-30T12:33:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向大型 AI 编码工作流，给出 HumanLayer 多代理协调协议的设计要点、任务委托参数与冲突解决策略。

### [在6502汇编上实现反向传播：Apple II微型神经网络的内存优化](/posts/2025/09/30/backpropagation-on-6502-assembly-for-apple-ii/)
- 日期: 2025-09-30T12:18:20+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨在Apple II的6502处理器上模拟反向传播算法，针对微型神经网络的内存高效梯度计算和权重更新，适应64KB限制。