ai-systems

机器智能

2025年09月16日

使用 Perplexica 和 Ollama 构建隐私优先的本地 RAG 搜索引擎

基于开源 Perplexica，利用 TypeScript 和本地 Ollama LLM 集成 RAG，实现无云依赖的隐私搜索引擎部署。

阅读全文 →

2025年09月16日

用纯 Rust 在 no_std 嵌入式环境中构建 Transformer LLM：自定义分词、内存高效注意力及无分配推理

针对 IoT 边缘 AI，介绍 no_std Rust 下 Transformer LLM 的自定义分词、固定内存注意力机制，以及无动态分配的推理优化要点。

阅读全文 →

2025年09月16日

DeepCode：多代理框架下论文到代码转换、Text2Web UI 生成与 Text2Backend API 实现

通过 DeepCode 的多代理 LLM 协调框架，实现论文到代码的自动化转换，以及 Text2Web 前端和 Text2Backend 后端的工程化参数与落地实践。

阅读全文 →

2025年09月16日

边缘设备部署 PaddleOCR：多语言文本识别与文档解析的低延迟量化优化

在边缘设备上部署PaddleOCR，实现多语言OCR与文档解析的低延迟推理，通过模型量化提供工程参数与监控要点。

阅读全文 →

2025年09月16日

利用 MLX-LM 在 Apple Silicon 上高效运行 LLM：推理、微调与优化

基于 MLX 框架，详述 Apple Silicon 上 LLM 的加载、推理加速、LoRA 微调集成及内存管理参数，实现低延迟文本生成。

阅读全文 →

2025年09月16日

工程化 Gemini 项目档案图像修复管道：噪声减少、颜色校正与 AI 上采样

面向 1960 年代太空档案照片，给出噪声减少、颜色校正和 AI 上采样工程化管道的参数与历史保真度监控要点。

阅读全文 →

2025年09月16日

工程化 LLM 友好型网络爬虫：语义分块与结构化提取优化 RAG 管道

利用 Crawl4AI 实现语义分块和结构化提取，提升网络爬取数据在 RAG 管道中的预处理效率，提供工程参数和监控要点。

阅读全文 →

2025年09月16日

基于 GE2E-Tacotron2-WaveRNN 的低延迟实时语音克隆工程实践

从 5 秒音频样本实现实时语音克隆的工程 pipeline：GE2E 编码、Tacotron2 生成与 WaveRNN 合成。

阅读全文 →

2025年09月16日

工程多代理LLM框架：实时市场分析与自动化交易执行

基于 ai-hedge-fund 项目，探讨多代理 LLM 系统在金融交易中的工程实践，包括并行协调、风险评估与执行参数配置。

阅读全文 →

2025年09月16日

基于系统卡附加的GPT-5-Codex工程化生产保障：安全评估、偏见缓解与可靠代码合成

基于GPT-5-Codex系统卡附加，阐述工程化生产保障，包括安全评估框架、偏见缓解机制及可靠代码合成管道的参数与监控要点。

阅读全文 →

2025年09月16日

工程化顶层规划代理：分层多代理任务分解

探讨如何设计顶层规划代理，将复杂任务分解为子任务，分配给专属下层代理，实现研究和通用AI工作流中的高效多代理协调。

阅读全文 →

2025年09月16日

用 TypeScript 构建 Midday AI 自由职业者发票后端：时间跟踪与文件对账工程实践

基于 Midday AI 开源项目，探讨 TypeScript 后端在自由职业者财务自动化中的工程实现，包括实时时间跟踪、AI 文件对账和集成助手的参数优化。

阅读全文 →

2025年09月16日

使用Ollama视觉模型增强Perplexica的多模态RAG管道：混合文本-图像检索与低延迟优化

在Perplexica本地RAG中集成Ollama视觉模型，实现混合文本-图像检索，优化嵌入融合与查询延迟低于500ms，无云依赖。

阅读全文 →

2025年09月16日

从Cursor、Devin和Replit代理提取系统提示：构建模块化、可复现LLM管道

基于Cursor、Devin和Replit代理的系统提示，工程化自定义代码生成与任务编排的模块化LLM管道，提供复现参数与清单。

阅读全文 →

2025年09月16日

基于 GE2E、Tacotron2 和 WaveRNN 的零样本语音克隆实时管道实现

探讨零样本语音克隆管道的工程实现，聚焦 GE2E 编码器提取说话者嵌入、Tacotron2 生成梅尔谱图以及 WaveRNN 低延迟波形合成，适用于实时交互系统。

阅读全文 →

2025年09月16日

使用 Trigger.dev 实现耐久、可观测的 AI 后台作业编排

在 AI 应用中，通过 Trigger.dev 实现后台作业的耐久执行、自动重试和队列管理，提供可观测性和可扩展性参数。

阅读全文 →

2025年09月16日

纯 Rust 从零实现 Transformer LLM：自定义分词与嵌入式优化

基于 RustGPT，讨论纯 Rust Transformer LLM 的从零实现，包括自定义分词、无分配注意力和 no-std 嵌入式推理优化。

阅读全文 →

2025年09月16日

使用 Semlib 构建语义数据处理管道：LLM 驱动的函数式编程实践

介绍 Semlib 如何利用 LLM 实现自然语言驱动的数据处理管道，包括 map、reduce 等原语的应用、并发优化与成本控制参数。

阅读全文 →

2025年09月16日

在 IDE 中集成 GPT-5-Codex API 实现多语言代码合成：聚焦上下文感知重构与自动化测试生成管道

本文指导开发者集成 GPT-5-Codex API 到 IDE，支持零-shot 多语言代码合成，重点分析上下文感知重构和自动化测试管道的实现策略与优化参数。

阅读全文 →

2025年09月16日

n8n 与 LLM 节点集成：构建无代码 AI 自动化管道

集成 n8n 工作流与 LLM 节点，实现无代码自动化管道，支持数据抓取、API 链式调用和条件分支决策，提升 AI 任务编排效率。

阅读全文 →

2025年09月16日

Pydantic-AI 与 FastAPI 集成：结构化数据验证与 MCP 服务器编排

在 AI web 服务中，利用 Pydantic-AI 和 FastAPI 实现结构化验证与 MCP 工具集成，提供类型安全和高效代理协调。

阅读全文 →

2025年09月16日

优化 Seed-VC DiT 模型的 F0 条件控制，实现实时歌唱语音转换

针对 Seed-VC DiT 模型的 F0 条件控制，给出实时歌唱语音转换的优化参数与延迟监控要点。

阅读全文 →

2025年09月16日

Orchestrating Multi-Agent LLMs for Paper-to-Code Conversion

探讨 DeepCode 项目中多代理系统如何通过规划、代码合成和验证管道，将研究论文转化为可执行代码，提供工程化参数和实施清单。

阅读全文 →

2025年09月16日

使用 Trigger.dev 编排可靠的 AI 工作流：持久执行、可观察队列与多模型链式

利用 Trigger.dev 构建容错代理管道，通过持久执行处理长时任务，可观察队列管理并发，以及多模型链式实现智能路由。

阅读全文 →

2025年09月16日

纯 Rust 从零实现 Transformer LLM：自定义分词与多头注意力机制，优化嵌入式 AI 推理

基于 RustGPT 项目，探讨纯 Rust 中构建 transformer LLM 的核心机制，包括自定义分词、多头注意力，以及针对嵌入式应用的推理优化参数与策略。

阅读全文 →

2025年09月16日

构建 RAG 增强的 Text-to-SQL LLM 流水线：模式检索、少样本提示与错误修正

面向企业数据库复杂自然语言查询，介绍 RAG 增强 LLM 流水线的构建，包括模式检索、少样本提示和错误修正机制，实现 90%+ 准确率的关键参数与落地清单。

阅读全文 →

2025年09月16日

实时语音克隆：GE2E低延迟集成与Tacotron2合成管道

构建5秒内声音克隆的实时合成管道，集成GE2E编码器优化低延迟嵌入提取与Tacotron2推理。

阅读全文 →

2025年09月16日

逆向工程 Cursor、Devin 和 Replit Agent 系统提示：构建自定义 Agentic LLM 管道

通过逆向工程流行 AI 工具的系统提示，提取角色定义、工具调用规则和行为约束，用于构建模块化代理管道，实现行为复制与工具集成。

阅读全文 →

2025年09月16日

从零实现 Transformer LLM：PyTorch 自定义分词、多头注意力与生成式训练循环

基于 PyTorch 从零构建 Transformer LLM，涵盖自定义分词、多头注意力及生成训练循环，提供工程参数与最佳实践。

阅读全文 →

2025年09月16日

SV2TTS 实时语音克隆低延迟部署：WebRTC 流式与 GPU 加速优化

基于 SV2TTS 架构，在交互式应用中实现 sub-200ms 延迟语音克隆，提供 encoder 合成优化参数、WebRTC 集成指南及监控要点。

阅读全文 →

2025年09月15日

使用 GE2E 编码器构建低延迟语音克隆管道：Tacotron2 与 WaveRNN 的多说话人适应

基于 SV2TTS 框架，探讨 GE2E 编码器在实时语音克隆中的应用，提供 Tacotron2 合成和 WaveRNN 声码器的工程化参数与多说话人适配策略。

阅读全文 →

2025年09月15日

构建多代理AI框架用于对冲基金交易：实时分析与风险建模

基于LLM的多代理系统在模拟对冲基金中的应用，涵盖市场分析、风险建模、投资组合再平衡及回测策略。

阅读全文 →

2025年09月15日

使用 OpenCode 构建终端 AI 编码代理：异步代码生成与 Shell 集成及批处理 CLI 工作流

基于 OpenCode 在终端中实现 AI 编码代理，支持异步代码生成、Shell 集成和批处理 CLI 工作流，提供工程化参数和监控要点。

阅读全文 →

2025年09月15日

Crawl4AI 中语义分块与结构化提取管道工程化：支持 RAG 工作流的精确数据隔离

通过 Crawl4AI 的语义分块策略和结构化提取，实现异步网页爬取与 JS 渲染，提供 LLM 优化的数据管道，确保 RAG 工作流中的数据精确性和效率。

阅读全文 →

2025年09月15日

工程化 Perplexica 的多模态 RAG 扩展：支持图像/文本混合查询

基于 Perplexica 开源框架，扩展多模态 RAG 管道，实现图像与文本混合查询的本地 LLM 推理与向量嵌入，保障隐私搜索。

阅读全文 →

2025年09月15日

工程化12k维嵌入模型：概念密集打包与检索去重优化

探讨如何工程化12k维嵌入模型，实现概念密集打包，支持可扩展语义搜索，重点包括余弦阈值去重和向量量化加速子线性查询。

阅读全文 →

2025年09月15日

工程化12k维嵌入以在LLM中密集打包数十亿概念

面向LLM中的概念打包，给出12k维嵌入的工程优化参数、检索阈值与密度指标监控要点。

阅读全文 →

2025年09月15日

在12k维度中工程化概念打包嵌入：将数十亿知识令牌压缩为高效语义向量

探讨如何在12k维度嵌入中实现概念打包，压缩亿级知识令牌，支持无损高效的语义检索与RAG系统。

阅读全文 →

2025年09月15日

工程化低维嵌入：将数十亿概念打包到12k维度中

面向可扩展的检索增强生成，探讨使用稀疏表示和语义聚类压缩海量概念知识到紧凑嵌入的技术。

阅读全文 →

2025年09月15日

DeepResearchAgent 中分层多代理系统的并行子代理执行工程化

探讨分层多代理系统中并行子代理执行的工程实践，包括任务分解、异步协调与资源优化参数。

阅读全文 →

2025年09月15日

工程化顶级规划代理：分层多代理协调中的任务分解与子代理并行执行

探讨顶级规划代理的设计与实现，用于任务分解和协调专化子代理，实现深度研究与通用任务的并行执行，提供工程参数与落地策略。

阅读全文 →

2025年09月15日

工程化顶层规划代理：协调专业下层代理在多样复杂领域的自动化任务分解与高效执行

在分层多代理系统中，设计顶层规划代理以协调专业下层代理，实现复杂任务的自动化分解与跨领域执行。提供工程参数、协调机制与落地指南，确保高效性和可扩展性。

阅读全文 →

2025年09月15日

JavaScript 中的 Genkit 多模型 AI 编排：Flows、RAG 与代理工作流

利用 Genkit Flows 在 Node.js 上构建可组合的多 LLM 管道，集成 RAG、向量数据库和代理机制，提供实用参数与部署指南。

阅读全文 →

2025年09月15日

使用 Haystack 构建生产级 LLM RAG 管道：组件编排与混合检索实践

通过 Haystack 框架的模块化组件，连接 LLM 模型、向量数据库和检索器，构建高效 RAG 管道。提供索引与查询管道配置、混合检索参数及代理编排指南，确保生产级部署与监控。

阅读全文 →

2025年09月15日

用神经场实现单图像镜头模糊建模：隐式表示与体积渲染

基于 Lens Blur Fields 技术，从单张图像实现真实镜头模糊效果。使用 MLP 隐式表示 PSF，结合深度估计和体积渲染，支持后处理管道中的零-shot 去焦模拟。

阅读全文 →

2025年09月15日

用 OpenCode 实现终端 AI 编码代理

基于 TypeScript 构建终端 AI 代理，支持本地 LLM 调用与文件 I/O，实现离线多步编码工作流，无需 IDE 依赖。

阅读全文 →

2025年09月15日

将脉冲神经元集成到7B大模型中实现事件驱动稀疏激活

通过生物启发阈值和delta编码，将脉冲神经元融入7B LLM，实现事件驱动稀疏激活，计算量减少50%，适用于高效设备端推理。

阅读全文 →

2025年09月15日

将脉冲神经元整合到7B规模LLM：事件驱动稀疏激活的能效推理

面向7B规模LLM，探讨脉冲神经元整合实现事件驱动稀疏激活的工程参数与能效优化要点。

阅读全文 →

2025年09月15日

Lightweight Semantic Parsing with Semlib: Entity Extraction and Relation Graphing

利用 Semlib 通过嵌入模型和规则推理从非结构化文本中提取实体并构建关系图，而不依赖重型 LLM。

阅读全文 →

2025年09月15日

Perplexica 中 TypeScript RAG 管道的优化：低延迟查询路由、混合搜索融合与可扩展向量索引

针对 Perplexica 的 TypeScript RAG 管道，给出低延迟查询路由、混合搜索融合与可扩展向量索引的优化参数与实现要点。

阅读全文 →

2025年09月15日

利用 MLX 统一内存、量化和 KV 缓存优化 Apple Silicon 上的 LLM 推理

面向 Apple Silicon 的 LLM 推理优化，给出 MLX-LM 中统一内存、量化与 KV 缓存的工程参数与多模型切换策略。

阅读全文 →

2025年09月15日

多代理 LLM 编排：从研究论文到可执行代码模块的零-shot 生成

通过 DeepCode 框架的多代理系统，实现研究论文到生产代码的自动化转换，支持模块化规划、验证与零-shot 应用生成。

阅读全文 →

2025年09月15日

使用 Genkit Flows 在 JavaScript 中编排多模型 AI 管道：可组合 RAG 与向量数据库集成

通过 Genkit Flows 实现 JavaScript 多 LLM 管道编排，集成 RAG 与向量 DB，支持插件式模型切换和类型安全工作流。

阅读全文 →

2025年09月15日

使用 Genkit Flows 编排 JavaScript 多 LLM 管道：可组合 RAG、向量数据库集成与代理工作流

在 Node.js 上利用 Genkit 构建多模型 AI 管道，聚焦 Flows 的可组合性、RAG 集成与代理工作流，提供落地参数与监控策略。

阅读全文 →

2025年09月15日

使用 Trigger.dev 编排可靠的 AI 应用后台作业：事件驱动触发与耐用执行

探讨 Trigger.dev 如何通过事件驱动、多步工作流和自动重试实现 AI 应用的耐用编排，提供配置参数和监控要点。

阅读全文 →

2025年09月15日

层级多代理系统中并行子代理执行的工程化实践

探讨 DeepResearchAgent 中并行子代理执行的实现机制，包括异步调度、资源协调与结果聚合，提供可落地参数与监控要点。

阅读全文 →

2025年09月15日

纯Rust从零构建Transformer LLM：高效分词、注意力机制与嵌入式推理

探讨在纯Rust中从头构建Transformer LLM，聚焦高效分词、自注意力机制及无外部ML库的推理优化，适用于嵌入式部署。提供关键参数、实现要点与落地指南。

阅读全文 →

2025年09月15日

纯 Rust 实现 Transformer LLM：自定义分词与高效推理

基于 RustGPT 项目，探讨纯 Rust 中 Transformer 架构的构建，包括自定义分词、多头注意力机制，以及轻量级部署的工程参数与优化策略。

阅读全文 →

2025年09月15日

将脉冲神经元工程化融入 7B LLM：通过时序编码实现事件驱动稀疏激活

面向 7B LLM，介绍 SpikingBrain 的脉冲神经元集成、事件驱动稀疏激活机制，以及低功耗推理的工程参数与效率基准。

阅读全文 →

2025年09月14日

用 Crawl4AI 构建异步 Python 爬虫：语义提取与 RAG 数据管道优化

基于 Crawl4AI 实现高效的异步 web 爬取，支持语义提取、去重过滤和 LLM 友好输出，适用于 RAG 数据管道。

阅读全文 →

2025年09月14日

构建低延迟语音克隆流水线：使用说话者嵌入、Tacotron2 合成与 WaveNet 声码器支持实时交互式语音代理的多说话者适应

面向实时交互式语音代理，构建低延迟语音克隆流水线，包括说话者嵌入提取、Tacotron2 文本到谱图合成，以及 WaveNet 声码器的高效波形生成，支持多说话者运行时适应。

阅读全文 →

2025年09月14日

使用 garak 核心探针构建生产级 LLM 安全审计管道

基于 garak 的内置探针，聚焦幻觉、毒性和提示注入，构建模块化 LLM 安全审计管道，提供生产化配置与监控要点。

阅读全文 →

2025年09月14日

使用 LLM 构建无服务器生成式电商后端：动态产品合成与支付集成

探讨基于查询的AI产品生成系统，聚焦serverless架构下的图像/文本合成、实时渲染及支付集成，实现无物理库存的电商模式。

阅读全文 →

2025年09月14日

构建 Perplexica：使用 TypeScript 和 RAG 管道的开源 AI 搜索引擎

通过 TypeScript 构建开源 AI 搜索引擎，集成 RAG 管道、向量嵌入和本地 LLM，实现隐私保护的语义搜索与实时答案合成。

阅读全文 →

2025年09月14日

Garak 中可扩展插件系统的设计：链式 LLM 漏洞检测器与动态风险评分

Garak的插件架构支持模块化扩展，实现LLM漏洞检测的链式处理和动态风险评估，提供红队工作流的工程化实现。

阅读全文 →

2025年09月14日

能量基Transformer：用能量函数替换Softmax实现稳定注意力机制

在Transformer注意力机制中，用能量函数取代Softmax可提升梯度稳定性和长上下文建模效率，提供PyTorch自定义层实现与优化参数。

阅读全文 →

2025年09月14日

工程化 garak 进行多模型链式漏洞探测与风险分数聚合

基于 garak 框架，设计多 LLM 链式探测脚本，实现风险分数聚合，支持安全基准测试与漏洞优先级排序。

阅读全文 →

2025年09月14日

工程化 Python 异步 Web 爬虫：为 LLM 优化，支持 JS 渲染、语义分块与 RAG 结构化提取

基于 Crawl4AI 实现异步 web 爬虫，聚焦 LLM 友好输出、动态内容捕获与高效 RAG 集成，提供工程参数与低延迟优化。

阅读全文 →

2025年09月14日

用Python工程语义感知web爬虫：异步抓取、内容提取与LLM优化分块

构建高效RAG数据管道的语义web爬虫工程实践，包括异步Python实现、提取策略与分块优化。

阅读全文 →

2025年09月14日

工程化顶层规划代理：任务分解为并行子代理，实现通用任务求解

探讨顶层规划代理如何将复杂任务分解为并行子代理执行，提供工程参数和配置指南，实现跨领域自动化求解。

阅读全文 →

2025年09月14日

工程化低延迟神经TTS管道：speaker embeddings、WaveNet声码器与实时推理

面向交互式语音代理，给出低延迟神经TTS管道的构建参数、优化策略与延迟监控要点。

阅读全文 →

2025年09月14日

基于MLX的Apple Silicon LLM推理管道工程：利用统一内存实现低延迟设备端生成、模型量化与多模型切换

探讨在Apple Silicon上使用MLX-LM构建LLM推理管道，利用统一内存优化低延迟生成，支持模型量化与多模型切换，提供工程参数与落地清单。

阅读全文 →

2025年09月14日

工程化顶层规划代理：分层多代理任务分解与并行执行

面向复杂研究任务，构建顶层规划代理以实现任务分解、并行执行、多跳检索与自适应协调的工程实践。

阅读全文 →

2025年09月14日

工程化顶级规划代理：分层多代理任务分解实现复杂研究的可扩展执行

基于DeepResearchAgent框架，探讨顶级规划代理的任务分解机制，支持并行子任务执行、多跳检索与跨领域适应，提供工程参数与监控要点。

阅读全文 →

2025年09月14日

使用 LLM 代理构建 AI 驱动的自由职业者发票 TypeScript 后端

探讨如何使用 TypeScript 工程化后端，支持 AI 驱动的发票处理、时间跟踪和文件对账，通过 LLM 代理实现自动化费用分类和客户报告生成。

阅读全文 →

2025年09月14日

使用 Bun 和 LLM 集成工程化 TypeScript 终端 AI 代码生成 CLI

基于 Bun 的并行依赖解析与 LLM 集成，构建高效终端 AI 代码生成 CLI，支持离线代码合成管道与多代理协作。

阅读全文 →

2025年09月14日

使用自定义插件扩展 garak：模块化 LLM 红队测试管道，聚焦探测器链式与风险评分

通过自定义插件扩展 garak 工具，实现模块化 LLM 红队测试，重点介绍探测器链式连接、风险评分机制，以及与生产推理管道的集成，用于高效幻觉探测。

阅读全文 →

2025年09月14日

Flash 线性注意力实现 Transformer 的 O(n) 缩放

通过高效 Triton 内核实现线性注意力，支持长序列 Transformer 的 O(n) 复杂度和子二次方计算，无需注意力掩码，提供工程化集成参数。

阅读全文 →

2025年09月14日

从零实现Transformer-based LLM：PyTorch训练管道构建与优化

基于Happy-LLM项目，探讨使用PyTorch从零构建Transformer LLM的训练管道，包括tokenization、注意力机制、fine-tuning及部署优化。

阅读全文 →

2025年09月14日

使用 Triton 融合线性注意力内核：长序列 Transformer 的亚二次复杂度优化

针对长序列 Transformer，利用 Triton 融合内核实现亚二次复杂度，通过重计算和分块策略最小化内存带宽。

阅读全文 →

第 63 / 66 页 · 共 5280 篇