# 分类：ai-systems

> 该分类下的文章按时间倒序排列，便于按主题继续深挖。

## 页面摘要
- 路径: /categories/ai-systems/page/70/
- 当前页: 70 / 75
- 文章总数: 5960
- 当前页文章数: 80

## 快速导航
- [首页](/)
- [分类索引](/categories/)
- [归档索引](/archive/)

## 本页文章
### [SGS-1几何约束求解器参数配置：实现模糊输入到精确CAD模型的稳定转换](/posts/2025/09/21/sgs-1-geometric-constraint-solver-parameters/)
- 日期: 2025-09-21T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 解析SGS-1如何通过几何约束求解器的参数配置，实现从模糊输入到精确、可编辑CAD模型的稳定转换。

### [SGS-1非Transformer架构下几何约束求解的工程化参数与策略](/posts/2025/09/21/sgs-1-geometric-constraint-solving-parameters/)
- 日期: 2025-09-21T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 解析Spectral Labs的SGS-1模型如何通过工程化参数与策略，实现物理设计中的高效几何约束求解，而非依赖传统神经网络参数。

### [SGS-1 如何用 GNN+扩散模型实现参数化 CAD 约束求解：节点特征、步长调度与损失函数](/posts/2025/09/21/sgs-1-gnn-diffusion-for-parametric-cad-constraints/)
- 日期: 2025-09-21T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 解析 Spectral Labs 的 SGS-1 模型，聚焦其非 Transformer 架构下，通过图神经网络与扩散过程协同求解 CAD 参数化约束的三项关键技术参数。

### [剖析SGS-1：GNN扩散架构如何精确求解几何约束以生成可编辑CAD模型](/posts/2025/09/21/sgs-1-gnn-diffusion-for-precise-cad-constraints/)
- 日期: 2025-09-21T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析SGS-1核心的GNN扩散架构，揭示其通过约束图建模与引导式扩散，实现参数化CAD模型精确生成与直接编辑的工程化路径。

### [SGS-1 非 Transformer 架构解析：参数化输出与几何约束求解的工程化路径](/posts/2025/09/21/sgs-1-non-transformer-cad-constraint-solving/)
- 日期: 2025-09-21T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 对比主流 Transformer 方案，解析 SGS-1 如何通过非序列化架构实现参数化 CAD 输出与混合约束求解，提供可落地的工程参数与监控清单。

### [SGS-1 非 Transformer 架构解析：绕开序列建模直接生成结构化 CAD 的工程要点](/posts/2025/09/21/sgs-1-non-transformer-cad-generation/)
- 日期: 2025-09-21T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 聚焦 SGS-1 如何抛弃 Transformer 序列依赖，通过空间关系编码与几何约束内嵌，实现可制造、拓扑有效的 CAD 模型直接生成。

### [构建首个结构化CAD生成模型SGS-1：从文本到精确工程图纸的端到端参数指南](/posts/2025/09/21/sgs-1-structured-cad-generation-parameters/)
- 日期: 2025-09-21T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向结构化CAD生成，解析SGS-1模型的核心设计哲学，并给出可落地的工程约束参数与调试清单，确保生成结果符合工业标准。

### [Tongyi DeepResearch 分层智能体编排：IterResearch 与 Research-Synthesis 工程实践](/posts/2025/09/21/tongyi-deepresearch-agent-orchestration/)
- 日期: 2025-09-21T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 解析 Tongyi DeepResearch 如何通过分层编排与多智能体协同，实现复杂研究任务的自动化分解与高效执行。

### [剖析 Tongyi DeepResearch 动态规划模块：路径生成与状态管理的工程实现](/posts/2025/09/21/tongyi-deepresearch-dynamic-planning-module-path-generation-and-state-management/)
- 日期: 2025-09-21T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析 Tongyi DeepResearch 中基于 WebWeaver 动态大纲的路径生成与状态管理机制，提供可落地的工程参数与监控策略。

### [通义DeepResearch多跳推理架构：IterResearch动态认知聚焦与并行合成框架](/posts/2025/09/21/tongyi-deepresearch-iterresearch-multi-hop-architecture/)
- 日期: 2025-09-21T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 剖析IterResearch如何通过研究轮次解构与精简工作空间，解决传统单窗口推理的认知窒息问题，并结合Research-Synthesis实现多智能体协同验证。

### [剖析Transformer架构如何工程化解构CAD生成：参数化、拓扑一致性与几何约束](/posts/2025/09/21/transformer-architectures-for-structured-cad-generation/)
- 日期: 2025-09-21T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析SGS-1等前沿模型如何将Transformer应用于CAD序列生成，通过参数量化、拓扑-几何解耦与分步扩散策略，解决结构化数据生成中的工程挑战。

### [剖析首个结构化CAD生成模型SGS-1：基于Transformer的序列架构与工程实现挑战](/posts/2025/09/21/transformer-based-cad-sequence-generation-architecture-and-engineering-challenges/)
- 日期: 2025-09-21T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 聚焦SGS-1模型，解析其基于Transformer处理CAD操作序列的核心架构，并探讨参数混合性、序列依赖与拓扑有效性等关键工程挑战。

### [为AI驱动的CAD系统调优几何约束求解器：一份工程化参数清单与监控策略](/posts/2025/09/21/tuning-geometric-constraint-solver-for-ai-cad/)
- 日期: 2025-09-21T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向高精度、可制造的AI生成CAD，提供一套通用的几何约束求解器核心参数调优清单与运行时监控策略，确保设计意图的准确实现。

### [调优几何约束求解器参数：容差、迭代与算法对CAD精度的影响](/posts/2025/09/21/tuning-geometric-constraint-solver-parameters-for-cad-precision/)
- 日期: 2025-09-21T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 从工程实践角度，解析容差、迭代次数与求解算法三大参数如何影响CAD模型的精度与稳定性，并提供可操作的调优清单。

### [Unsloth低显存微调实战：消费级GPU高效训练参数全解析](/posts/2025/09/21/unsloth-low-vram-finetuning-guide/)
- 日期: 2025-09-21T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 详解如何在12GB至24GB显存的消费级GPU上，通过Unsloth框架实现2-5倍加速与70%显存节省，完成主流大模型的高效微调。

### [重构数据架构：原生支持AI代理的并发、状态与工具链](/posts/2025/09/20/agent-native-data-architecture/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向AI代理的长时运行与协作需求，详解数据系统如何重构以支持状态持久化、高并发调度与安全工具集成。

### [构建可复用大模型行为数据集：指令设计与蒸馏参数清单](/posts/2025/09/20/building-reusable-llm-behavior-datasets/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 提供一套可操作的参数与检查清单，将大模型行为稳定蒸馏为可复用数据集，用于微调或评估，降低对原始模型的依赖。

### [Claude 生成可验证代码：契约驱动的局部验证路径与校验清单](/posts/2025/09/20/claude-contract-driven-verification/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 聚焦高危函数，通过参数化提示约束 Claude 输出带前置/后置条件的代码契约，结合 Frama-C 等轻量工具实现局部形式化验证，规避全自动证明的陷阱。

### [Claude 4 形式化验证实用化路径：生成可验证代码与辅助规约](/posts/2025/09/20/claude-formal-verification-practical-path/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探索 Claude 4 系列模型在形式化验证领域的实用化潜力，聚焦生成结构化可验证代码与辅助形式化规约两大路径，提供可落地的工程参数与协作清单。

### [CopilotKit React UI 与 Agentic 后端集成工程实践](/posts/2025/09/20/copilotkit-react-ui-agentic-backend-integration/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 深入解析 CopilotKit 的 React UI 组件与 Agentic 后端架构集成，提供生产级部署参数与状态管理最佳实践。

### [DeepResearch代理框架解析：分层规划与工具调用如何驱动多跳推理](/posts/2025/09/20/deepresearch-multi-hop-architecture-principles/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 聚焦DeepResearch框架的核心架构，解析其如何通过分层规划与工具协同，将复杂研究任务拆解为可执行的多跳推理链。

### [通义 DeepResearch 中分层代理编排：多跳推理与工具链的动态规划](/posts/2025/09/20/engineer-hierarchical-agent-orchestration-tongyi-deepresearch-multi-hop-reasoning/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 IterResearch 范式，探讨 Tongyi DeepResearch 如何实现分层代理协调，支持复杂研究查询中的多跳推理、工具链执行与动态规划，提供工程参数与落地清单。

### [工程化模块化 Jupyter 管道：12 周 AI 初学者课程构建](/posts/2025/09/20/engineer-modular-jupyter-pipelines-for-ai-curriculum/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对初学者 AI 教育，设计模块化 Jupyter 管道，集成交互代码执行、测验和可扩展部署，提供工程参数与最佳实践。

### [使用 TimesFM 构建可扩展零样本预测管道：针对资源受限边缘设备的多元时间序列推理](/posts/2025/09/20/engineer-scalable-zero-shot-forecasting-timesfm-edge/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 TimesFM 的 Transformer 解码器和 patching 技术，实现边缘设备上的高效零样本多元时间序列预测，提供优化参数和实施清单。

### [Detectron2生产管道工程化：ONNX导出、自定义ROIAlign与多尺度推理优化](/posts/2025/09/20/engineering-detectron2-for-production-onnx-export-custom-roialign-multi-scale-inference-optimization/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对生产环境下的目标检测与分割，探讨Detectron2管道的ONNX导出、自定义ROIAlign实现及多尺度推理优化策略，提供可落地参数与监控要点。

### [从现有LLM逆向蒸馏行为数据集：格式、参数与副作用监控](/posts/2025/09/20/extract-behavior-dataset-from-llm/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 聚焦从教师模型逆向提取结构化行为数据集的工程化流程，给出数据格式、采样参数与跨域副作用评估要点，用于微调或评估而非训练新模型。

### [从LLM中提取行为数据集：一种高效的知识蒸馏新范式](/posts/2025/09/20/extracting-behavioral-datasets-from-llms/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 详解如何从现有大型语言模型中系统性提取结构化行为数据集，用于训练更小、更高效或特定领域的学生模型，涵盖技术原理、实施步骤与潜在风险。

### [分层代理编排实现多跳推理：工具链动态规划与稳定性控制](/posts/2025/09/20/hierarchical-agent-orchestration-for-multi-hop-reasoning/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 解析Tongyi DeepResearch的分层代理架构，提供Heavy模式参数配置、工具链动态规划阈值与训练稳定性回滚策略。

### [将 Gemini API 集成到 Chrome：实现实时多模态 AI 处理](/posts/2025/09/20/integrate-gemini-api-chrome-real-time-multimodal-ai/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 Chrome 浏览器，集成 Gemini API 实现实时多模态 AI：处理标签内容、生成代码、图像/文本查询，支持流式响应与设备端推理。

### [构建模块化机器人AI运行时：传感器融合与低延迟决策的工程实践](/posts/2025/09/20/modular-robot-ai-runtime-sensor-fusion-latency/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于OM1框架，详解如何通过模块化设计与去中心化协议，实现多传感器数据的实时融合与毫秒级决策响应。

### [为AI代理设计运行时模式演化的数据层：自动检测、动态触发与零停机参数清单](/posts/2025/09/20/runtime-schema-evolution-for-ai-agents/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向AI代理的不可预测读写，给出支持运行时模式演化的数据层设计要点、关键工程参数与监控清单，确保零停机与自动向下传播。

### [通义DeepResearch的IterResearch范式：分层代理动态规划与工具链编排实战](/posts/2025/09/20/tongyi-deepresearch-iterresearch-dynamic-planning/)
- 日期: 2025-09-20T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于IterResearch范式，详解分层代理如何通过动态工作空间重构实现多跳推理与工具链编排，给出可落地的参数配置与监控回滚策略。

### [构建 Omi 穿戴设备边缘 ML 管道：实时语音捕获与转录](/posts/2025/09/19/build-edge-ml-pipeline-for-omi-real-time-speech-capture-and-transcription/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向低功耗穿戴硬件，给出 Omi 项目中实时语音转录的边缘 ML 管道设计、优化参数与监控要点。

### [使用 CopilotKit 构建应用内 AI 副驾驶：React UI 与 Agentic 后端集成](/posts/2025/09/19/build-in-app-ai-copilots-with-copilotkit-integrating-react-ui-and-agentic-backend/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 CopilotKit 如何将 React UI 与 agentic 后端集成，构建高效的 AI 聊天机器人和自主代理，包括关键参数和最佳实践。

### [基于 PaddleOCR 的多语言 OCR 与 LLM 集成管道构建](/posts/2025/09/19/build-multilingual-ocr-llm-pipelines-paddleocr/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 结合 PaddleOCR 多语言 OCR 能力与 LLM，实现扫描文档的智能结构化提取与数字化。

### [使用Rust构建集成Ollama的本地终端编码代理：实时代码合成与RAG检索](/posts/2025/09/19/build-rust-cli-pipelines-with-ollama-for-local-code-synthesis-and-rag-retrieval/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 无云依赖的终端编码代理，用Rust CLI集成Ollama LLM，实现代码生成、调试、补全及RAG检索，提供落地参数。

### [基于 TT-Buda 构建 TT-NN 操作库与 Metalium 低级内核：Wormhole AI 芯片的高吞吐量推理优化](/posts/2025/09/19/build-tt-nn-operator-library-metalium-kernels-wormhole-buda-optimized-inference/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 TT-Buda 编译框架，构建 TT-NN 操作库和 Metalium 低级内核，实现 Wormhole AI 芯片上神经网络的高吞吐量推理，提供优化参数与工程实践要点。

### [构建 Cactus 框架：智能手机低功耗 AI 推理部署](/posts/2025/09/19/building-cactus-framework-low-power-ai-inference-smartphones/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 YC 支持的 Cactus Compute 框架，实现智能手机上低功耗 AI 模型的实时推理与优化，支持边缘设备部署。

### [构建多跳 RAG 管道：深度研究代理的迭代检索与合成](/posts/2025/09/19/building-multi-hop-rag-pipelines-for-deep-research-agents/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向深度研究代理，构建多跳 RAG 管道，实现迭代查询扩展、多源证据检索与结构化合成，包含引用跟踪的工程参数与清单。

### [基于 RAG 的 ArXiv 论文问答聊天系统：语义搜索与引用提取实现](/posts/2025/09/19/building-rag-based-chat-system-for-arxiv-papers-semantic-search-and-citation-extraction/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 构建 ArXiv 论文 RAG 聊天系统，支持语义搜索、LLM 查询和引用提取，实现高效文献交互。

### [构建RAG增强的Text-to-SQL管道：动态Schema检索与迭代修正](/posts/2025/09/19/building-rag-enhanced-text-to-sql-pipeline-dynamic-schema-retrieval-iterative-correction/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向企业级问数，详解RAG驱动的动态Schema检索、查询分解及错误修正机制，提供集成参数与安全清单。

### [使用 TEN Framework 工程化多轮语音 AI 代理的低延迟 C 管道](/posts/2025/09/19/engineer-low-latency-c-pipelines-multi-turn-voice-ai-agents-ten-framework/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 TEN Framework，在资源受限硬件上构建低延迟 C 管道，集成实时 ASR、NLU 和 TTS，支持多轮对话代理。

### [使用 Detectron2 构建生产级实时目标检测与分割管道：ONNX 导出与自定义 ROIAlign 多尺度推理](/posts/2025/09/19/engineer-production-ready-detectron2-cv-pipelines-onnx-export-and-custom-roialign-for-multi-scale-inference/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Detectron2 工程化实时视觉管道，聚焦 ONNX 边缘部署与 ROIAlign 多尺度优化，提供参数配置与监控要点。

### [使用 OpenAI Codex 工程化 Rust 终端编码代理：实时代码合成与 RAG 上下文](/posts/2025/09/19/engineer-rust-terminal-agent-openai-codex-rag-local-fallback/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 OpenAI Codex CLI 的 Rust 终端代理，实现实时代码生成、调试和自动补全，集成 RAG 提供代码库上下文，并支持本地 LLM 回退机制。

### [使用 MarkItDown 构建 AI 辅助的文档到 Markdown 转换管道](/posts/2025/09/19/engineering-ai-assisted-pipelines-with-markitdown-for-document-to-markdown-conversion/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 RAG/LLM 工作流，给出 MarkItDown 工具的工程化管道构建、布局解析与表格提取参数。

### [基于 PP-OCRv4 的边缘部署 OCR 管道工程：PTQ、ONNX 导出与运行时优化实现实时多语言文本检测与识别](/posts/2025/09/19/engineering-edge-deployable-ocr-pipelines-with-pp-ocrv4-ptq-onnx-export-and-runtime-optimizations-for-real-time-multilingual-text-detection-and-recognition-on-resource-constrained-devices/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 PP-OCRv4 构建资源受限设备上的实时多语言 OCR 管道，涵盖 PTQ 量化、ONNX 导出及运行时优化，提供工程参数与监控要点。

### [工程化生成式 AI 管道：动态教科书个性化适配](/posts/2025/09/19/engineering-generative-ai-pipelines-dynamic-textbook-personalization/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 构建生成式 AI 管道，实现教科书的动态个性化，包括解释生成、互动练习和实时内容合成，提供工程参数与落地清单。

### [从单一提示工程化 LLM 驱动的全栈应用代码生成：自动 schema 设计、CRUD API 与持久数据库集成](/posts/2025/09/19/engineering-llm-driven-code-generation-for-prompt-to-full-stack-apps-with-database/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 LLM 从单一提示生成全栈应用的工程实践，包括 schema 设计、API 端点与数据库集成，提供参数配置与监控要点。

### [工程化 LLM 多代理管道实现实时波动预测与动态对冲策略](/posts/2025/09/19/engineering-llm-multi-agent-pipelines-for-volatility-prediction-and-hedging-in-ai-hedge-funds/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 LLM 协调的多代理系统在 AI 对冲基金中的应用，聚焦实时波动预测、动态投资组合再平衡及自适应对冲策略的工程参数与落地清单。

### [工程化 ArXiv 论文的 RAG 管道：语义搜索、LLM 问答与交互聊天](/posts/2025/09/19/engineering-rag-pipeline-for-arxiv-papers-semantic-search-llm-qa-and-interactive-chat/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 针对 ArXiv 学术论文构建检索增强生成 (RAG) 系统，实现语义搜索、基于 LLM 的问答、引用提取及带来源链接的交互式聊天界面，提供工程实现要点、参数配置和监控建议。

### [用 Python 工程化 Tongyi DeepResearch 代理实现多跳推理：工具调用编排与迭代查询细化](/posts/2025/09/19/engineering-tongyi-deepresearch-agents-for-multi-hop-reasoning/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 指导在 Python 中构建 Tongyi DeepResearch 代理，聚焦多跳推理的工具调用管理和迭代查询优化，适用于复杂研究任务。

### [增强 SQLBot 的 RAG 管道：动态 schema 检索、查询分解与错误反馈循环](/posts/2025/09/19/enhance-sqlbot-rag-pipeline-dynamic-schema-query-decomposition-error-feedback-loops/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过动态 schema 检索、查询分解和错误反馈机制，提升 SQLBot 在复杂多表查询和聚合场景下的 SQL 生成准确性，给出工程化参数和监控要点。

### [通过 WebNN API 在 Chrome 扩展中集成 Gemini Nano 实现本地 JS/TS 代码自动完成](/posts/2025/09/19/gemini-nano-webnn-code-autocompletion/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Gemini Nano 和 WebNN API 在 Chrome 扩展中构建设备端代码自动完成功能，支持实时代码片段生成和错误检测。

### [DeepResearch 中的分层代理规划：多跳 RAG 与工具调用工程实践](/posts/2025/09/19/hierarchical-agent-planning-deepresearch/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 工程视角下 Tongyi DeepResearch 的分层代理，支持多跳 RAG 检索与动态工具调用，实现复杂任务自动化规划。

### [使用 WebNN API 在 Chrome 扩展中实现 Gemini Nano 的 JS/TS 代码自动完成](/posts/2025/09/19/implement-gemini-nano-in-chrome-extensions-via-webnn-for-js-ts-code-autocompletion/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 通过 WebNN API 集成 Gemini Nano，实现实时本地 JS/TS 代码自动完成，支持 token 流式输出和语法上下文注入，提升开发效率。

### [在Cactus框架中实现INT8训练后量化和NPU卸载：移动设备低延迟LLM推理](/posts/2025/09/19/implement-int8-ptq-and-npu-offload-in-cactus-for-low-latency-mobile-llm-inference/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于Cactus框架，探讨INT8 PTQ与NPU卸载的集成，提供量化阈值、运行时分区参数和性能监控要点，实现手机端高效LLM推理。

### [用 Rust 实现基于 RAG 的终端编码代理：本地 LLM 增强代码库检索](/posts/2025/09/19/implementing-a-rust-based-terminal-coding-agent-with-rag-and-local-llm-for-codebase-retrieval/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 OpenAI Codex CLI，构建无云依赖的终端代理，使用 RAG 从代码库检索上下文，支持本地 LLM 进行准确代码合成和调试。

### [使用 Rust 实现高斯溅射的实时 3D 场景重建与浏览器渲染](/posts/2025/09/19/implementing-gaussian-splatting-rust-real-time-3d-reconstruction-browser-webgpu/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Brush 项目，探讨从单目视频利用高斯溅射进行实时 3D 重建的 Rust 实现，支持 WebGPU 浏览器渲染，实现可访问的 AR/VR 管道。

### [在 Chrome 中通过 WebNN API 实现 Gemini Nano 的本地标签组织、写作辅助与提示增强](/posts/2025/09/19/implementing-gemini-nano-in-chrome-via-webnn-api-for-local-tab-organization-writing-assistance-and-prompt-enhancement/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Gemini Nano 和 WebNN API 在 Chrome 中构建隐私友好的 on-device AI 功能，包括标签智能组织、写作辅助和提示优化。

### [在 Wormhole AI 芯片上实现 TT-NN 操作符与 Metalium 内核：借助 TT-Buda 优化张量计算](/posts/2025/09/19/implementing-tt-nn-operators-metalium-kernels-on-wormhole-ai-chip-with-tt-buda-optimizations/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 TT-Metalium 开发低级内核，并在 Wormhole 上通过 TT-Buda 实现张量优化与融合，提供工程参数与监控要点。

### [Cactus框架下INT8量化与NPU加速的低功耗AI推理管道](/posts/2025/09/19/int8-quantization-and-npu-acceleration-in-cactus-for-low-power-smartphone-ai-inference/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于Cactus框架，结合INT8量化与NPU硬件加速，实现智能手机低功耗多模态AI模型部署，支持实时语音与视觉任务的工程参数与优化策略。

### [通过 WebNN 在 Chrome 扩展中集成 Gemini Nano：本地标签聚类、内容摘要与 AI 提示生成](/posts/2025/09/19/integrate-gemini-nano-webnn-chrome-extensions-tab-clustering-summarization-prompt-generation/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 Gemini Nano 在 Chrome 扩展中实现本地标签聚类、内容摘要和 AI 提示生成，提升实时浏览生产力。

### [Chrome 中通过 WebNN API 集成 Gemini Nano：浏览器端本地 AI 推理实践](/posts/2025/09/19/integrate-gemini-nano-webnn-chrome-on-device-ai/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在 Chrome 浏览器中利用 WebNN API 集成 Gemini Nano，实现设备端 AI 任务如标签页总结和内容生成，提供离线工程化参数与监控要点。

### [OpenAI Codex CLI 与本地 LLM 离线回退集成：终端 RAG 检索与代码合成指南](/posts/2025/09/19/integrate-openai-codex-cli-local-llm-fallback-offline-rag-terminal/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在低资源硬件终端环境中，集成官方 OpenAI Codex CLI 与本地 LLM 回退，实现离线 RAG 检索、代码合成及调试，提供混合在线-离线管道的工程化参数与优化策略。

### [Integrate React UI with AI Copilot Infrastructure Using CopilotKit](/posts/2025/09/19/integrate-react-ui-with-ai-copilot-infrastructure-using-copilotkit/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 使用 CopilotKit 集成 React UI 组件与后端基础设施，实现 AI 副驾驶的 in-app 聊天机器人、状态同步和工具调用。

### [SQLBot 与企业数据库集成：安全 RAG Text-to-SQL 实现](/posts/2025/09/19/integrate-sqlbot-enterprise-secure-rag-text-to-sql/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨 SQLBot 在企业环境中通过 RAG 和 LLM 实现安全的 Text-to-SQL，重点包括 schema 检索、查询生成、迭代修正及角色访问控制，以降低注入风险和数据泄露。

### [通过 WebNN API 将 Gemini Nano 集成到 Chrome 中实现设备端 AI 任务](/posts/2025/09/19/integrating-gemini-nano-with-webnn-in-chrome-for-on-device-ai/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用 WebNN 在 Chrome 中运行 Gemini Nano，实现离线文本摘要和提示增强，提供启用指南和优化参数。

### [Integrating SQLBot RAG Pipeline: Dynamic Schema Retrieval, Query Decomposition, and Error Feedback](/posts/2025/09/19/integrating-sqlbot-rag-for-dynamic-schema-query-decomposition-and-error-feedback/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用SQLBot的RAG机制，实现动态schema检索与查询分解，支持错误反馈循环，提升复杂SQL生成的准确性和鲁棒性。

### [集成SQLBot RAG管道：动态Schema检索、查询分解与错误反馈](/posts/2025/09/19/integrating-sqlbot-rag-pipeline-dynamic-schema-retrieval-query-decomposition-and-error-feedback/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用SQLBot的RAG机制，实现动态schema检索与查询分解，支持错误反馈循环，提升复杂SQL生成的准确性和鲁棒性。

### [使用 WebNN API 在浏览器扩展中嵌入 Gemini Nano：JS/TS 代码自动补全](/posts/2025/09/19/leverage-webnn-api-to-embed-gemini-nano-in-browser-extensions-for-js-ts-code-autocompletion/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向 JS/TS 编辑器，给出 Gemini Nano 在浏览器扩展中的集成参数与代码辅助管道。

### [AI对冲基金的多代理交易：基于LLM的实时市场分析与风险对冲](/posts/2025/09/19/multi-agent-trading-in-ai-hedge-funds-llm-based-real-time-analysis-and-risk-hedging/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 探讨如何通过多代理系统协调LLM代理，实现市场分析、交易执行、风险对冲和投资组合再平衡的工程化实践。

### [SQLBot 中多轮 SQL 生成工程化：RAG 驱动的查询分解与错误反馈循环](/posts/2025/09/19/multi-turn-sql-generation-sqlbot-rag-error-correction/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 面向动态数据库的多轮 Text-to-SQL，介绍 SQLBot 中的 RAG 查询分解、动态 schema 检索及 LLM 错误反馈循环的工程参数与实现要点。

### [nvmath-python：cuBLAS与cuSOLVER的Python绑定加速ML线性代数](/posts/2025/09/19/nvmath-python-cublas-cusolver-bindings-for-ml-linear-algebra/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 利用nvmath-python绑定cuBLAS和cuSOLVER，实现GPU加速的线性代数操作，支持ML管道中的张量分解和稀疏求解，提升训练可扩展性。

### [SQLBot 中查询分解与错误反馈：优化动态 Schema 下的 Text-to-SQL](/posts/2025/09/19/query-decomposition-and-error-feedback-in-sqlbot-optimizing-text-to-sql-for-dynamic-schemas/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 集成查询分解与错误反馈机制，提升 SQLBot 在复杂动态数据库中的 Text-to-SQL 准确率。

### [RAG增强的Text-to-SQL管道：动态模式检索、多步查询分解与LLM错误反馈](/posts/2025/09/19/rag-enhanced-text-to-sql-query-decomposition/)
- 日期: 2025-09-19T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 工程化RAG增强Text-to-SQL系统，聚焦动态schema检索、多步分解及错误反馈循环。

### [构建AI代理自动化竞争编程：问题解析、C++代码生成与提交](/posts/2025/09/18/building-ai-agents-for-competitive-programming-automation/)
- 日期: 2025-09-18T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 介绍AI代理在竞争编程中的应用管道，包括解析问题、生成优化C++代码、符号执行测试和自动化提交。

### [构建AI代理自动化ICPC竞赛：问题解析、C++代码生成与提交](/posts/2025/09/18/building-ai-agents-for-icpc-automation-problem-parsing-c-plus-plus-code-gen-and-submissions/)
- 日期: 2025-09-18T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 介绍AI代理在竞争编程中的应用管道，包括解析问题、生成优化C++代码、符号执行测试和自动化提交。

### [构建开源 Perplexity AI 替代品：本地 LLM 集成与隐私搜索](/posts/2025/09/18/building-open-source-perplexity-ai-alternative-with-local-llm-integration/)
- 日期: 2025-09-18T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 基于 Perplexica 项目，探讨本地 LLM 集成实现隐私优先的 AI 搜索，支持 RAG 和多模态查询，提供部署参数与优化策略。

### [使用 RAG 增强的 Text-to-SQL 系统：基于 LLM 的模式检索、查询生成与迭代纠错](/posts/2025/09/18/building-rag-enhanced-text-to-sql-llm-for-schema-retrieval-query-generation-and-iterative-error-correction/)
- 日期: 2025-09-18T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 构建 RAG 增强的 Text-to-SQL 系统，利用 LLM 进行模式检索、查询生成及迭代纠错，处理复杂数据库查询，减少幻觉。

### [终端部署轻量级 OpenAI Codex CLI：利用 Rust 集成实现低延迟代码合成与调试](/posts/2025/09/18/deploy-lightweight-openai-codex-cli-terminal-real-time-code-synthesis-debugging-autocompletion-local-llm-rust/)
- 日期: 2025-09-18T20:46:50+08:00
- 分类: [ai-systems](/categories/ai-systems/)
- 摘要: 在终端中部署 OpenAI Codex CLI，通过 Rust 核心和本地沙箱，支持实时代码合成、调试与自动补全，实现低延迟边缘计算。